ディープラーニングの仕組み: 今日の AI を支えるニューラル ネットワークの内部を覗いてみよう

ディープラーニングの仕組み: 今日の AI を支えるニューラル ネットワークの内部を覗いてみよう

[[428985]]

[51CTO.com クイック翻訳]今日の人工知能の繁栄は、人工ニューラルネットワークに基づくディープラーニングと呼ばれる技術と切り離せません。この記事では、これらのニューラル ネットワークがどのように構築され、トレーニングされるかをグラフィカルに説明します。

図1. アーキテクチャ図

人工ニューラル ネットワーク内の各ニューロンは入力を合計し、活性化関数を適用して出力を決定します。このアーキテクチャは、ニューロンがシナプスを介して互いに信号を伝達する脳内のメカニズムにヒントを得ています。

図2

これは、仮想的なフィードフォワード ディープ ニューラル ネットワーク (複数の隠し層があるため「ディープ」) のアーキテクチャです。この例では、手書きの数字の画像を解釈し、それを 10 個の可能な数字の 1 つに分類するネットワークを示します。

入力層には多数のニューロンが含まれており、それぞれのニューロンには画像内のピクセルのグレースケール値に設定されたアクティベーションがあります。これらの入力ニューロンは次の層のニューロンに接続され、重みと呼ばれる何らかの値で乗算された後にアクティブ化レベルを渡します。 2 番目の層の各ニューロンは、多数の入力を合計し、活性化関数を適用して出力を決定し、同様にフィードフォワードされます。

電車

このニューラル ネットワークは、実際の出力と予想される出力の差を計算することによってトレーニングされます。ここでの数学的最適化問題には、ネットワーク内の調整可能なパラメータ(主にニューロン間の接続の重み、正 [青線] または負 [赤線] になるもの)と同じ数の次元があります。

ネットワークをトレーニングするということは、本質的には、この多次元の「損失」または「コスト」関数の最小値を見つけることです。これは複数回のトレーニングを通じて反復的に実行され、ネットワークの状態が徐々に変化します。実際には、一連のランダムな入力例に対して計算された出力に基づいて、ネットワークの重みに多くの小さな調整を加える必要があり、そのたびに出力層の重みを制御することから始めて、ネットワークを逆方向に進めていきます。 (わかりやすくするために、ここでは各層の 1 つのニューロンに関連付けられた接続のみを示しています。) このバックプロパゲーション プロセスは、損失関数が最小化され、ネットワークが新しい入力に対して可能な限り最良の結果を提供するまで、ランダムなトレーニング例のセットに対して繰り返されます。

図3

図4

ステップ 1 : 入力に手書きの「3」が表示されると、トレーニングされていないネットワークの出力ニューロンがランダムにアクティブ化されます。 3 に関連付けられた出力ニューロンは高い活性化 [暗い陰影] を示し、他の出力ニューロンは低い活性化 [明るい陰影] を示すことが期待されます。したがって、たとえば、3 に関連付けられたニューロンの活性化を増やす必要があります [紫色の矢印]。

図5

ステップ 2 : これを行うには、2 番目の隠し層のニューロンから数字「3」の出力ニューロンへの接続の重みがより正の値になる必要があります [黒い矢印]。変化の大きさは、接続された隠しニューロンのアクティブ化に比例します。

図6

ステップ 3 : 次に、2 番目の隠し層のニューロンに対して同様のプロセスを実行します。たとえば、ネットワークの精度を高めるには、この層の最上位ニューロンの活性化を下げる必要があるかもしれません [緑の矢印]。最初の隠し層への接続の重みを調整することで、ネットワークをその方向に押し進めることができます [黒い矢印]。

図7

ステップ 4 : 次に、最初の隠しレイヤーに対してこのプロセスを繰り返します。たとえば、レイヤーの最初のニューロンをよりアクティブにする必要があるかもしれません [オレンジ色の矢印]。

原題: ディープラーニングの仕組み 今日の AI を支えるニューラルネットワークの内側、著者: サミュエル・K・ムーア、デビッド・シュナイダー、エリザ・ストリックランド

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  人工知能はソフトウェア開発のパラダイムを変えている

>>:  Facebookは人々の生活を一人称で分析する新しいAIシステムを開発中

ブログ    

推薦する

情報理論に基づくキャリブレーション技術により、マルチモーダル機械学習の信頼性が向上

マルチモーダル機械学習は、さまざまなシナリオで目覚ましい進歩を遂げています。しかし、マルチモーダル学...

携帯電話の通話は安全ではない、GSM暗号化アルゴリズムが破られた

今では、ほとんどの人が携帯電話を持つことに慣れています。しかし、携帯電話の盗聴を扱った映画のように、...

Google、再生可能エネルギーと機械学習の力を借りて風力発電の予測に成功

従来の観点から見ると、目に見えず、実体のない風が新しい日にどのような挙動を示すかを予測することは依然...

知っておくべき 8 つのニューラル ネットワーク アーキテクチャ

ニューラル ネットワークは機械学習におけるモデルの一種です。ニューラル ネットワークは、機械学習の分...

人工知能とセキュリティ:繋がる双子

何十年もの間、セキュリティは重要であると考えられてきましたが、いわゆる「コアビジネス」機能に関与した...

近年の機械学習の奇妙な状況

翻訳者注:人工知能分野の発展は学者の貢献と切り離せないものです。しかし、研究が進むにつれて、「クリッ...

プログラマーにとって「朗報」:AI が人間のコード作成を支援することは信頼できるのか?

[[264055]]データマップ:ゲーム会社のプログラマー。写真提供:ユー・チン、中国新聞社午前9...

スマートドライビングが誕生してから10年経った今、なぜ理想的なビジネスモデルの実現が難しいのでしょうか?

[[420239]] 2011年7月14日、紅旗HQ3は長沙から武漢までの286キロの高速道路を疾...

百度の最新アルゴリズム調整対応戦略

Baiduの最新アルゴリズム調整対応戦略、4つの対策でBaiduの最新アルゴリズム調整に対応します。...

ロボット宅配便があなたの玄関までお届けします!フォードが「無人配送」の最後のハードルを解決

Google と Amazon が競い合っている無人配達市場を覚えていますか? そこに新たなプレーヤ...

DALL·E 3のベンチマーク!メタ最強の文豪エミュの技術レポートを公開

数日前、OpenAIはDALL·E 3をリリースしたばかりで、ビジュアルイメージは再び新たな段階に上...

...

これほど長い時間が経ったのに、なぜ物流ロボットは何千もの家庭に導入されていないのでしょうか?

先日終了したCESで、ドイツのコンチネンタルAGは、新しい物流ロボット、荷物配達ロボット犬「ANYM...

Google が AI ジェスチャー認識アルゴリズムをオープンソース化: 1 フレームの画像で 21 個の 3D ポイントを認識

リアルタイムの手の形状と動作の追跡ソリューションは、常に手話認識とジェスチャー制御システムの最も重要...

...