ディープラーニングの仕組み: 今日の AI を支えるニューラル ネットワークの内部を覗いてみよう

ディープラーニングの仕組み: 今日の AI を支えるニューラル ネットワークの内部を覗いてみよう

[[428985]]

[51CTO.com クイック翻訳]今日の人工知能の繁栄は、人工ニューラルネットワークに基づくディープラーニングと呼ばれる技術と切り離せません。この記事では、これらのニューラル ネットワークがどのように構築され、トレーニングされるかをグラフィカルに説明します。

図1. アーキテクチャ図

人工ニューラル ネットワーク内の各ニューロンは入力を合計し、活性化関数を適用して出力を決定します。このアーキテクチャは、ニューロンがシナプスを介して互いに信号を伝達する脳内のメカニズムにヒントを得ています。

図2

これは、仮想的なフィードフォワード ディープ ニューラル ネットワーク (複数の隠し層があるため「ディープ」) のアーキテクチャです。この例では、手書きの数字の画像を解釈し、それを 10 個の可能な数字の 1 つに分類するネットワークを示します。

入力層には多数のニューロンが含まれており、それぞれのニューロンには画像内のピクセルのグレースケール値に設定されたアクティベーションがあります。これらの入力ニューロンは次の層のニューロンに接続され、重みと呼ばれる何らかの値で乗算された後にアクティブ化レベルを渡します。 2 番目の層の各ニューロンは、多数の入力を合計し、活性化関数を適用して出力を決定し、同様にフィードフォワードされます。

電車

このニューラル ネットワークは、実際の出力と予想される出力の差を計算することによってトレーニングされます。ここでの数学的最適化問題には、ネットワーク内の調整可能なパラメータ(主にニューロン間の接続の重み、正 [青線] または負 [赤線] になるもの)と同じ数の次元があります。

ネットワークをトレーニングするということは、本質的には、この多次元の「損失」または「コスト」関数の最小値を見つけることです。これは複数回のトレーニングを通じて反復的に実行され、ネットワークの状態が徐々に変化します。実際には、一連のランダムな入力例に対して計算された出力に基づいて、ネットワークの重みに多くの小さな調整を加える必要があり、そのたびに出力層の重みを制御することから始めて、ネットワークを逆方向に進めていきます。 (わかりやすくするために、ここでは各層の 1 つのニューロンに関連付けられた接続のみを示しています。) このバックプロパゲーション プロセスは、損失関数が最小化され、ネットワークが新しい入力に対して可能な限り最良の結果を提供するまで、ランダムなトレーニング例のセットに対して繰り返されます。

図3

図4

ステップ 1 : 入力に手書きの「3」が表示されると、トレーニングされていないネットワークの出力ニューロンがランダムにアクティブ化されます。 3 に関連付けられた出力ニューロンは高い活性化 [暗い陰影] を示し、他の出力ニューロンは低い活性化 [明るい陰影] を示すことが期待されます。したがって、たとえば、3 に関連付けられたニューロンの活性化を増やす必要があります [紫色の矢印]。

図5

ステップ 2 : これを行うには、2 番目の隠し層のニューロンから数字「3」の出力ニューロンへの接続の重みがより正の値になる必要があります [黒い矢印]。変化の大きさは、接続された隠しニューロンのアクティブ化に比例します。

図6

ステップ 3 : 次に、2 番目の隠し層のニューロンに対して同様のプロセスを実行します。たとえば、ネットワークの精度を高めるには、この層の最上位ニューロンの活性化を下げる必要があるかもしれません [緑の矢印]。最初の隠し層への接続の重みを調整することで、ネットワークをその方向に押し進めることができます [黒い矢印]。

図7

ステップ 4 : 次に、最初の隠しレイヤーに対してこのプロセスを繰り返します。たとえば、レイヤーの最初のニューロンをよりアクティブにする必要があるかもしれません [オレンジ色の矢印]。

原題: ディープラーニングの仕組み 今日の AI を支えるニューラルネットワークの内側、著者: サミュエル・K・ムーア、デビッド・シュナイダー、エリザ・ストリックランド

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  人工知能はソフトウェア開発のパラダイムを変えている

>>:  Facebookは人々の生活を一人称で分析する新しいAIシステムを開発中

ブログ    
ブログ    

推薦する

...

地図メーカーの次の戦い:AI戦争

新しいインフラの下で、産業インターネット、5G基地局建設、都市間高速鉄道と都市間軌道交通、新エネルギ...

Twitter が名前を X に変更し、マスク氏が X の世界を爆発させた! AIから宇宙探査まで、ユニバーサルアプリが形になりつつある

今、ボス・マーの「Xユニバース」がまた成長しました。それ以来、Twitter は単なるソーシャル ネ...

人工知能技術が農業に革命を起こす

国際的に著名な学者である周海中教授は、1990年代に「科学技術の進歩により、人工知能の時代が到来しよ...

...

大規模言語モデルと知識グラフに関する共同研究のレビュー:2つの相補的な技術的利点

大規模言語モデル (LLM) はすでに強力ですが、さらに強力になる可能性があります。 LLM は、ナ...

Linux の割り込み処理メカニズムを使用してシステムパフォーマンスを向上させる

Linux 割り込み処理メカニズムを使用すると、システム パフォーマンスが大幅に向上します。割り込み...

...

ソースディレクトリ内のファイルをプレフィックスに応じて異なるディレクトリに分散するためのアルゴリズム設計と C コードの実装

1. 要件の説明Linux システムのソース ディレクトリには、同じサフィックスを持つファイルがいく...

...

スキルマップは、自動運転技術の開発経路が非常にシンプルであることを示しています

2015年8月から現在までに、人工知能、フロントエンド開発、モバイル開発、クラウドコンピューティング...

...

NVIDIA は 3 か月で 800 トンの H100 を販売しました。黄氏が1兆ドル規模のGPU覇者の「3つのノー」戦略を明かす

今年の第 2 四半期だけで、Nvidia は 816 トンの H100 を販売しました。同じペースで...

人工知能は研究をどのように変えているのでしょうか?

人工知能 (AI) は研究プロセスにおいてますます重要な役割を果たしています。 AI ベースのアルゴ...

...