ディープラーニングのための 5 つのニューラルネットワークモデルとその応用

[[349567]]

[51CTO.com クイック翻訳] ニューラルネットワークは、一連のデータ内の潜在的な関係を識別する一連のアルゴリズムです。これらのアルゴリズムは、人間の脳の働きに大きく依存しています。ニューラルネットワークは、出力基準を再設計することなく、変化する入力に適応して最適な結果を生み出すことができます。ある意味では、これらのニューラルネットワークは生物学的ニューロンのシステムに似ています。

ディープラーニングは機械学習の重要な部分であり、ディープラーニングアルゴリズムはニューラルネットワークに基づいています。特定のアプリケーションシナリオに最適な、さまざまな機能を備えたニューラルネットワークアーキテクチャがいくつかあります。この記事では、特にディープラーニング向けの最もよく知られているアーキテクチャのいくつかを紹介します。

多層パーセプトロン

多層パーセプトロン (MLP) は、フィードフォワード人工ニューラルネットワークの一種です。パーセプトロンという用語は、特に、より大きなニューラルネットワークの前身となった単一のニューロンモデルを指します。

MLP は、入力層、隠し層、出力層の 3 つの主要なノード層で構成されます。隠し層と出力層の両方で、各ノードは非線形活性化関数を使用してニューロンとして扱われます。 MLP は、バックプロパゲーションと呼ばれる教師あり学習手法を使用してトレーニングされます。ニューラルネットワークを初期化するときに、各ニューロンの重みを設定します。バックプロパゲーションは、ニューロンの重みを調整して目的の出力に近づけるのに役立ちます。

MLP は、表形式のデータセット、分類予測問題、回帰予測問題を含むプロジェクトに最適です。

畳み込みニューラルネットワーク

畳み込みニューラルネットワーク (CNN) モデルは、画像などのグリッドパターンを持つデータを処理します。特徴の空間階層を自動的に学習することを目的としています。 CNN には通常、畳み込み層、プーリング層、完全接続層という 3 種類の層が含まれます。

畳み込み層とプーリング層は特徴抽出のタスクを実行し、抽出された特徴は完全に接続された層によって最終出力にマッピングされます。 CNN は画像処理に最適です。

画像認識、画像分類、物体検出、顔認識などは、CNN の応用シナリオの一部です。

リカレントニューラルネットワーク

再帰型ニューラルネットワーク (RNN) では、前のステップの出力が現在のステップへの入力としてフィードバックされます。 RNN の隠し層はこのフィードバックシステムを実装します。この隠し状態には、シーケンス内の前のステップに関する情報を保存できます。

RNN の「メモリ」は、計算されたすべての情報をモデルが記憶するのに役立ちます。次に、同じパラメータを使用して各入力から出力が生成され、パラメータの複雑さが軽減されます。

RNN は、主に優れた学習能力と、手書き学習や音声認識などの複雑なタスクを実行できる能力により、最も広く使用されているニューラルネットワークのタイプの 1 つです。 RNN が適用できるその他の分野としては、予測問題、機械翻訳、ビデオのタグ付け、テキストの要約、さらには音楽作曲などがあります。

ディープビリーフネットワーク

Deep Belief Networks (DBN) は、確率と教師なし学習を使用して出力を生成します。 DBN は、バイナリ潜在変数、無向層、有向層で構成されます。 DBN は、各層が順番に調整され、各層が入力全体を学習するという点で他のモデルとは異なります。

DBN では、各サブネットワークの隠し層が次のサブネットワークの可視層になります。この組み合わせにより、レイヤーごとの高速な教師なしトレーニングプロセスが可能になります。つまり、最下位の可視レイヤーから始めて、各サブネットワークに対照的な違いが適用されます。 DBN のトレーニングには貪欲学習アルゴリズムが使用されます。学習システムは一度に 1 つのレイヤーを学習します。したがって、各レイヤーは異なるバージョンのデータを受け取り、各レイヤーは前のレイヤーの出力を入力として使用します。

DBN は主に画像認識、ビデオ認識、モーションキャプチャデータに使用されます。

制限付きボルツマンマシン

ボルツマンマシン (RBM) は、入力セットに対して確率分布を学習する生成的非決定論的 (確率論的) ニューラルネットワークです。 RBM は、ディープビリーフネットワークの構成要素となる浅い 2 層のニューラルネットワークです。 RBM の最初の層は可視層または入力層と呼ばれ、2 番目の層は隠し層と呼ばれます。これは、ノードと呼ばれるニューロンのようなユニットで構成されます。ノードは、同じレイヤー内ではなく、レイヤー間で相互に接続されます。

RBM は、次元削減、推奨システム、トピックモデリングなどのアプリケーションシナリオでよく使用されます。しかし、近年では、生成的敵対的ネットワーク (GAN) が徐々に RBM に取って代わってきました。

原題: ディープラーニングのためのトップ 5 ニューラルネットワークモデルとそのアプリケーション、著者: Shraddha Goled

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<: アルゴリズムは AI の進歩の原動力となることができるでしょうか?

>>: クラウドで必要な 5 つの機械学習スキル

ブログ

ハードコア冬季オリンピック！上海交通大学が開発した、障害物を回避したり方向転換したりできるスキーロボットがオンラインになった。

ブログ

中国、自動運転を含む情報技術の注目の10大問題を発表

ブログ

ディープラーニングのための 5 つのニューラルネットワークモデルとその応用

Belcorp CIO: AI による IT 研究開発の見直し

5Gの商用化は加速し続け、自動運転との統合における価値が強調される

AIが写真を見て場所を推測、その精度は90%以上！スタンフォードの最新のPIGEONモデル：予測誤差の40％は25キロメートル未満

ハードコア冬季オリンピック！上海交通大学が開発した、障害物を回避したり方向転換したりできるスキーロボットがオンラインになった。

中国、自動運転を含む情報技術の注目の10大問題を発表

推薦する

調査によると、2024年は「AIメガネ」市場元年となる

感情知能の高いNPCがやって来て、手を伸ばすとすぐに次の行動に協力する準備が整いました。

AI人材の世界的な需要が急増、一部の職種では年間40万ドル近くを稼ぐ

AIが気候変動に効果的に対抗する方法

人工知能によって作られた、素晴らしい美しさと能力を持つ美しいロボット

ロボットが家事の仕事を代行：人間のデモンストレーション動画を見るだけで、10時間でコーヒーの淹れ方を学ぶ

2022年、PyTorchはトップAIカンファレンスの80%を占める

ジャック・マー：世界の未来を決めるのは技術ではなく、技術の背後にある人々、理想、価値観だ

Linux搭載のAppleコンピュータにグラフィックカードドライバが搭載され、初めてOpenGL ES標準と互換性があるとネットユーザーが語る：リバースエンジニアリングの巨人

分析技術は、2019-nCoVの潜在的な感染を追跡し予測するのに役立っています。

ロボットの認識システムはどのように機能するのでしょうか?

Tech Neo 12月号：人工知能の応用シナリオ