ハードコア科学: たった一文で、話題の「ニューラル ネットワーク」とは何なのか説明できますか?

ハードコア科学: たった一文で、話題の「ニューラル ネットワーク」とは何なのか説明できますか?

私の誠意を示すために、この短くて鋭い真実をここに述べます。

ニューラル ネットワークは、 相互接続された多数のニューロン構成されたコンピューティング モデルです

とても複雑ですか?実はとても簡単です。これを読んだ後、あなたはため息をつき、「特別なことじゃない」と言うでしょう。

ニューラルネットワークとは何ですか?運用モデル。

計算モデルとは何ですか?入力値のセットから出力値のセットを計算する方法を記述するモデル。

たとえば、線形方程式 z=2x+3y+5 は、入力が x と y、出力が z である計算モデルです。 z=2x+3y+5 によれば、x と y が与えられると、計算モデルである z が得られます。

出力は複数の値になる可能性があることに注意してください。たとえば、入力が x と y の場合、出力は 2 つの値 z1 と z2 になります。ここで、z1=2x+3y+5、z2=6x+8y+8 です。これも計算モデルと考えることができます。

ニューラル ネットワークは計算モデルをどのように表現するのでしょうか?多数のニューロンが相互に接続されています。

下の図はニューラルネットワークを示しています。ニューロンの一番左の垂直列 (青いノード) は入力層と呼ばれ、入力値をインポートする役割を担います。右端のニューロンの縦列 (緑のノード) は出力層と呼ばれ、出力値を導出する役割を担います。中央の 2 列のニューロン (黒いノード) は、隠れ層と呼ばれます。これらのニューロンと、それらの間の接続が計算モデルを表します。

たとえば、線形方程式 z=2x+3y+5 は、以下に示すニューラル ネットワークで表すことができます。

図では、2と3は重み値、5はバイアス値と呼ばれます。

一般的に言えば、隠れ層のニューロンへの接続 (ラベル 2 および 3 が付いている接続など) のみに重み値があり、隠れ層のニューロン (ラベル 5 が付いているニューロン) のみにバイアス値があります。重みとバイアスは、通常、ニューラル ネットワークでは注釈が付けられません。

ニューラル ネットワークでは、ニューロンの数は任意であり、ニューロン間の接続も変化させることができます。

ニューロンとその接続を数式に変換する方法については、ここでは詳しく説明しません。ニューラル ネットワークは本質的に計算モデルであることを覚えておいてください。十分な数のニューロンがあれば、非常に複雑な操作、つまり入力と出力の間の非常に複雑な関係を表すことができます

この時点で、「ニューラル ネットワークは、相互接続された多数のニューロンで構成されたコンピューティング モデルである」という定義は非常に明確になっているはずです。

計算モデルを表現するためにニューラル ネットワークを使用するのはなぜですか?数式を使うほうが良いのではないでしょうか?

ニューラル ネットワークは、入力値と出力値のみがわかっていて入力値と出力値の関係がわからない状況向けに設計されています。たとえば、x=1 のとき y=2、z=13 であることと、x=2 のとき y=1、z=12 であることしかわかっていませんが、x と y に基づいて z を計算する式はわかりません。

単純な入力と出力の関係に直面すると、方程式を直接解くことができるかもしれません。しかし、極めて複雑な入力と出力の場合はどうでしょうか?たとえば、入力がこの画像のピクセルである場合、出力は画像内のすべての文字になります。これも典型的な画像認識タスクです。

[[361373]]

このとき、ニューラルネットワークが必要になります。ニューラル ネットワークが十分に複雑である限り (十分なニューロンと適切なニューロン接続) 、このニューラル ネットワークは、取得したい入力値と出力値の関係を表現できると信じることができます。

「可能」とは、ニューラル ネットワークが入力値と出力値の関係を正確に表現できるようする特定の重み値とバイアス値が存在することを意味します。ただし、これらの重みとバイアスの値はわからない場合があります。

ニューラル ネットワークが十分に強力であると仮定した場合、重みとバイアスをどのように取得するのでしょうか?

これには、人工知能における最も重要な技術である機械学習における教師あり学習を導入する必要があります。

まず、重みとバイアスの値がランダムに推測され、その後、これらのパラメータが反復的に徐々に更新され、与えられた入力値の下で、ニューラル ネットワークの出力値と実際の既知の出力値との差が徐々に減少します。このニューラル ネットワークが入力値と出力値の関係を大まかかつ正確に表現できるようになるまで、それが私たちが得ることを望んでいる計算モデルです。

<<:  配達員に代わるドローン配達は、人々に「嫌われるのではなく愛される」ようになる

>>:  2020 年の AI と分析の 5 つの災害

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

機械学習のための3つの主要な学習リソースを丁寧に整理

機械学習はここしばらく話題になっていますが、それには十分な理由があります。機械学習は、将来の行動を予...

偉大な人物が学界に復帰:何開明氏がMITへの入学を発表

「FAIR研究科学者として、私は2024年にMITのEECS教授陣に加わります。」 AI分野の著名な...

世界人工知能会議が終了しました。今後、AIは私たちの生活にどのように浸透していくのでしょうか?

過去 2 年間で最もホットな話題は何かと聞かれれば、人工知能は間違いなくそのリストに載るでしょう。金...

ニューラルネットワークにおける分位点回帰と分位点損失

機械学習を使って予測モデルを構築する場合、単に「予測値(点予測)」を知りたいのではなく、「予測値が特...

マスクを着用しているときでも顔認識は役立ちますか?

[[415947]]顔認識技術は今や私たちの生活のあらゆる側面に浸透しています。公共の安全、スマー...

...

将来の教育において人工知能が果たす12の役割

近年、人工知能は急速に発展し、熱い議論を巻き起こしています。人工知能が人間に取って代わるかどうかが注...

機能テストケース自動生成アルゴリズム ペアワイズ

[[433685]]ペアワイズアルゴリズムとは何ですか?次のテストシナリオの場合:ブラウザ: M、O...

...

OpenAIは、かつてAGIロボットの開発に取り組んだロボット工学チームを解散。創設者:最良の決断

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Ali Wensheng ビデオが Gen-2 と Pika に挑戦、1280×720 の解像度で圧迫感なし、3500 万のテキスト ビデオ表示効果

ヴィンセントのビデオはどの程度詳細にできますか?最近、アリババの調査により、1280×720 の解像...

AGI(汎用人工知能)は数年のうちに実現されるでしょうか? 3つのテクノロジー大手が判決を下す

2011年、Google DeepMindの共同創設者であるシェーン・レッグは、2028年までにAI...

Baidu は、「同様のデータセットの 10 倍」のデータ量を持つ自動運転データセットをリリースしました。注目すべき点は何ですか?

[[222004]]常にオープンで、常に新しいメンバーを引き付けてきた百度のアポロ自動運転プラット...

スマート農業は収穫アシスタントとなる新しいアップグレードロボットを歓迎する

「農業」は国家の基盤です。基盤がしっかりしていれば国家は平和になります。農業は国民経済の建設と発展を...