ハードコア科学: たった一文で、話題の「ニューラル ネットワーク」とは何なのか説明できますか?

ハードコア科学: たった一文で、話題の「ニューラル ネットワーク」とは何なのか説明できますか?

私の誠意を示すために、この短くて鋭い真実をここに述べます。

ニューラル ネットワークは、 相互接続された多数のニューロン構成されたコンピューティング モデルです

とても複雑ですか?実はとても簡単です。これを読んだ後、あなたはため息をつき、「特別なことじゃない」と言うでしょう。

ニューラルネットワークとは何ですか?運用モデル。

計算モデルとは何ですか?入力値のセットから出力値のセットを計算する方法を記述するモデル。

たとえば、線形方程式 z=2x+3y+5 は、入力が x と y、出力が z である計算モデルです。 z=2x+3y+5 によれば、x と y が与えられると、計算モデルである z が得られます。

出力は複数の値になる可能性があることに注意してください。たとえば、入力が x と y の場合、出力は 2 つの値 z1 と z2 になります。ここで、z1=2x+3y+5、z2=6x+8y+8 です。これも計算モデルと考えることができます。

ニューラル ネットワークは計算モデルをどのように表現するのでしょうか?多数のニューロンが相互に接続されています。

下の図はニューラルネットワークを示しています。ニューロンの一番左の垂直列 (青いノード) は入力層と呼ばれ、入力値をインポートする役割を担います。右端のニューロンの縦列 (緑のノード) は出力層と呼ばれ、出力値を導出する役割を担います。中央の 2 列のニューロン (黒いノード) は、隠れ層と呼ばれます。これらのニューロンと、それらの間の接続が計算モデルを表します。

たとえば、線形方程式 z=2x+3y+5 は、以下に示すニューラル ネットワークで表すことができます。

図では、2と3は重み値、5はバイアス値と呼ばれます。

一般的に言えば、隠れ層のニューロンへの接続 (ラベル 2 および 3 が付いている接続など) のみに重み値があり、隠れ層のニューロン (ラベル 5 が付いているニューロン) のみにバイアス値があります。重みとバイアスは、通常、ニューラル ネットワークでは注釈が付けられません。

ニューラル ネットワークでは、ニューロンの数は任意であり、ニューロン間の接続も変化させることができます。

ニューロンとその接続を数式に変換する方法については、ここでは詳しく説明しません。ニューラル ネットワークは本質的に計算モデルであることを覚えておいてください。十分な数のニューロンがあれば、非常に複雑な操作、つまり入力と出力の間の非常に複雑な関係を表すことができます

この時点で、「ニューラル ネットワークは、相互接続された多数のニューロンで構成されたコンピューティング モデルである」という定義は非常に明確になっているはずです。

計算モデルを表現するためにニューラル ネットワークを使用するのはなぜですか?数式を使うほうが良いのではないでしょうか?

ニューラル ネットワークは、入力値と出力値のみがわかっていて入力値と出力値の関係がわからない状況向けに設計されています。たとえば、x=1 のとき y=2、z=13 であることと、x=2 のとき y=1、z=12 であることしかわかっていませんが、x と y に基づいて z を計算する式はわかりません。

単純な入力と出力の関係に直面すると、方程式を直接解くことができるかもしれません。しかし、極めて複雑な入力と出力の場合はどうでしょうか?たとえば、入力がこの画像のピクセルである場合、出力は画像内のすべての文字になります。これも典型的な画像認識タスクです。

[[361373]]

このとき、ニューラルネットワークが必要になります。ニューラル ネットワークが十分に複雑である限り (十分なニューロンと適切なニューロン接続) 、このニューラル ネットワークは、取得したい入力値と出力値の関係を表現できると信じることができます。

「可能」とは、ニューラル ネットワークが入力値と出力値の関係を正確に表現できるようする特定の重み値とバイアス値が存在することを意味します。ただし、これらの重みとバイアスの値はわからない場合があります。

ニューラル ネットワークが十分に強力であると仮定した場合、重みとバイアスをどのように取得するのでしょうか?

これには、人工知能における最も重要な技術である機械学習における教師あり学習を導入する必要があります。

まず、重みとバイアスの値がランダムに推測され、その後、これらのパラメータが反復的に徐々に更新され、与えられた入力値の下で、ニューラル ネットワークの出力値と実際の既知の出力値との差が徐々に減少します。このニューラル ネットワークが入力値と出力値の関係を大まかかつ正確に表現できるようになるまで、それが私たちが得ることを望んでいる計算モデルです。

<<:  配達員に代わるドローン配達は、人々に「嫌われるのではなく愛される」ようになる

>>:  2020 年の AI と分析の 5 つの災害

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ジェネレーティブAIを管理する方法

ドム・クッドウェル著ノアが編集制作:51CTO テクノロジースタック(WeChat ID:blog)...

...

公共の安全とスマートシティ:AIがどのように役立つか

近年、人工知能の進歩により、私たちのコミュニティの安全性は大幅に向上しました。この技術は、緊急管理者...

...

AIプログラミングは原作者を打ち負かす。プログラマー:私が書いたプログラムのせいで失業した

ブルームバーグとインテル研究所の研究者2人が、遺伝的アルゴリズムとチューリング完全な言語を使用して、...

アリババはどうやって1分で会話型ロボットを作ったのでしょうか?

[[319957]] Alimeiの紹介:2020年に突然発生したCOVID-19パンデミックに直...

堅牢な機械学習アルゴリズムの構築方法: ブースティングとバギング

[[211376]]機械学習とデータサイエンスの作業は、単にデータを Python ライブラリに渡し...

...

...

人工知能の時代でも様々な外国語を学ぶことは必要なのでしょうか?

[[254738]]文部科学省が公表した2017年度版の高等学校総合学習の計画と14項目の学習指導...

スマートホームからのプライバシー漏洩が心配ですか?エッジAIがあなたを助けてくれることを恐れないでください

アレクサ、私の話を盗み聞きしてるの? [[330887]]私はいつもAmazon Echoにこの質問...

...

DeepMindが乳がん診断AIをリリース:市場に投入するにはまだ多くの課題がある

GoogleのDeepMindチームは最近、「乳がんスクリーニングAIシステムの国際評価」と題した論...

GPT-4を直接使用してエアコンを制御する、マイクロソフトのトレーニング不要の手法によりLLMは産業用制御に向けて前進

大規模言語モデル (LLM) 技術が成熟するにつれて、その適用範囲が拡大しています。インテリジェント...

人工知能バブルの次のラウンドは、消費者向けロボットによって引き起こされるかもしれません。

ロボット業界ではここ1か月間、大きなニュースが数多くあり、大きな注目を集めています。テンセントが率い...