ディープラーニングのための 5 つのニューラル ネットワーク モデルとその応用

ディープラーニングのための 5 つのニューラル ネットワーク モデルとその応用

[[349567]]

[51CTO.com クイック翻訳] ニューラル ネットワークは、一連のデータ内の潜在的な関係を識別する一連のアルゴリズムです。これらのアルゴリズムは、人間の脳の働きに大きく依存しています。ニューラル ネットワークは、出力基準を再設計することなく、変化する入力に適応して最適な結果を生み出すことができます。ある意味では、これらのニューラル ネットワークは生物学的ニューロンのシステムに似ています。

ディープラーニングは機械学習の重要な部分であり、ディープラーニングアルゴリズムはニューラルネットワークに基づいています。特定のアプリケーション シナリオに最適な、さまざまな機能を備えたニューラル ネットワーク アーキテクチャがいくつかあります。この記事では、特にディープラーニング向けの最もよく知られているアーキテクチャのいくつかを紹介します。

多層パーセプトロン

多層パーセプトロン (MLP) は、フィードフォワード人工ニューラル ネットワークの一種です。パーセプトロンという用語は、特に、より大きなニューラル ネットワークの前身となった単一のニューロン モデルを指します。

MLP は、入力層、隠し層、出力層の 3 つの主要なノード層で構成されます。隠し層と出力層の両方で、各ノードは非線形活性化関数を使用してニューロンとして扱われます。 MLP は、バックプロパゲーションと呼ばれる教師あり学習手法を使用してトレーニングされます。ニューラル ネットワークを初期化するときに、各ニューロンの重みを設定します。バックプロパゲーションは、ニューロンの重みを調整して目的の出力に近づけるのに役立ちます。

MLP は、表形式のデータセット、分類予測問題、回帰予測問題を含むプロジェクトに最適です。

畳み込みニューラルネットワーク

畳み込みニューラル ネットワーク (CNN) モデルは、画像などのグリッド パターンを持つデータを処理します。特徴の空間階層を自動的に学習することを目的としています。 CNN には通常、畳み込み層、プーリング層、完全接続層という 3 種類の層が含まれます。

畳み込み層とプーリング層は特徴抽出のタスクを実行し、抽出された特徴は完全に接続された層によって最終出力にマッピングされます。 CNN は画像処理に最適です。

画像認識、画像分類、物体検出、顔認識などは、CNN の応用シナリオの一部です。

リカレントニューラルネットワーク

再帰型ニューラル ネットワーク (RNN) では、前のステップの出力が現在のステップへの入力としてフィードバックされます。 RNN の隠し層はこのフィードバック システムを実装します。この隠し状態には、シーケンス内の前のステップに関する情報を保存できます。

RNN の「メモリ」は、計算されたすべての情報をモデルが記憶するのに役立ちます。次に、同じパラメータを使用して各入力から出力が生成され、パラメータの複雑さが軽減されます。

RNN は、主に優れた学習能力と、手書き学習や音声認識などの複雑なタスクを実行できる能力により、最も広く使用されているニューラル ネットワークのタイプの 1 つです。 RNN が適用できるその他の分野としては、予測問題、機械翻訳、ビデオのタグ付け、テキストの要約、さらには音楽作曲などがあります。

ディープビリーフネットワーク

Deep Belief Networks (DBN) は、確率と教師なし学習を使用して出力を生成します。 DBN は、バイナリ潜在変数、無向層、有向層で構成されます。 DBN は、各層が順番に調整され、各層が入力全体を学習するという点で他のモデルとは異なります。

DBN では、各サブネットワークの隠し層が次のサブネットワークの可視層になります。この組み合わせにより、レイヤーごとの高速な教師なしトレーニング プロセスが可能になります。つまり、最下位の可視レイヤーから始めて、各サブネットワークに対照的な違いが適用されます。 DBN のトレーニングには貪欲学習アルゴリズムが使用されます。学習システムは一度に 1 つのレイヤーを学習します。したがって、各レイヤーは異なるバージョンのデータを受け取り、各レイヤーは前のレイヤーの出力を入力として使用します。

DBN は主に画像認識、ビデオ認識、モーションキャプチャデータに使用されます。

制限付きボルツマンマシン

ボルツマン マシン (RBM) は、入力セットに対して確率分布を学習する生成的非決定論的 (確率論的) ニューラル ネットワークです。 RBM は、ディープ ビリーフ ネットワークの構成要素となる浅い 2 層のニューラル ネットワークです。 RBM の最初の層は可視層または入力層と呼ばれ、2 番目の層は隠し層と呼ばれます。これは、ノードと呼ばれるニューロンのようなユニットで構成されます。ノードは、同じレイヤー内ではなく、レイヤー間で相互に接続されます。

RBM は、次元削減、推奨システム、トピック モデリングなどのアプリケーション シナリオでよく使用されます。しかし、近年では、生成的敵対的ネットワーク (GAN) が徐々に RBM に取って代わってきました。

原題: ディープラーニングのためのトップ 5 ニューラル ネットワーク モデルとそのア​​プリケーション、著者: Shraddha Goled

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  アルゴリズムは AI の進歩の原動力となることができるでしょうか?

>>:  クラウドで必要な 5 つの機械学習スキル

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

FacebookのAIはたった1語で手書きを真似できるが、オープンソース化するには強力すぎる

Facebook は最近、画像内のテキスト スタイルをコピーして再現できる新しい画像 AI「Text...

...

ウォータールー大学はヒートマップ回帰を放棄し、複数人の姿勢推定のための新しい方法を提案した。

[[436983]]キーポイント推定は、画像内の関心ポイントを特定するコンピューター ビジョン タ...

OpenAI が GPT-5 の商標登録を申請: すでに開発計画に入っているのか?

GPT-4 のリリースから半年も経たないうちに、GPT-5 がもうすぐ登場するのでしょうか?最近、...

ディープラーニング GPU の最も包括的な比較: コスト パフォーマンスの点で最も優れているのはどれですか?

AI に関して言えば、「GPU の混乱」を感じない人はいないでしょう。 Tensor コア、メモリ...

三方からのアプローチ! AIがサイバーセキュリティを強化

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

大規模モデルの観点から見た因果推論

1. 因果推論と大規模モデル近年、因果推論は研究のホットスポットとなり、多くのシナリオに適用されてき...

今年のノーベル賞はアルトゥール・エケルト氏が受賞すると見られている。百度研究所の科学者の力を過小評価すべきではない。

2019年のノーベル賞受賞者のリストは、今年10月7日から発表されます。発表日が近づくにつれ、学界...

畳み込みニューラルネットワークにおけるパラメータ共有/重みの複製

パラメータの共有や重みの複製は、ディープラーニングでは見落とされがちな領域です。しかし、この単純な概...

...

...

安定的な動画拡散をリリースしました! 3D合成機能が注目を集める、ネットユーザー「進歩が速すぎる」

安定拡散当局はついにこのビデオに対して行動を起こした――生成ビデオモデルStable Video D...

テレンス・タオ:初心者はAIツールを使って専門家レベルのタスクを実行すべきではないし、GPTは専門家にとってあまり役に立たない

著名な数学者テレンス・タオ氏はここ数か月、ChatGPTなどの大規模モデルAIツールを使用して数学の...

...