機械学習、ディープラーニング、強化学習の関係と違いは何ですか?

機械学習、ディープラーニング、強化学習の関係と違いは何ですか?

これには、機械学習のサブフィールドの分類が含まれます。すべての分類において、最初に尋ねるべき質問は、なぜそのように分けられているのかということです。どの次元で分割されますか?論理的な分類は人々の認知的枠組みを確立するのに役立ちますが、非論理的な分類は人々を混乱させる可能性があります。

1. 機械学習は人工知能のサブフィールドである

人工知能のサブフィールドは、歴史を通じて発展してきたため、比較的明確な特徴を持っています。大まかに分けると以下のようになります。

  •  推論期間  ”:自動定理証明やチェスシステムDeepBlueを含む検索に関する研究
  • 単に推論できるだけでは、幅広い知識を必要とする実践的な問題に対処することはできません。 「  知識期間  」、Prolog、さまざまなエキスパートシステム、今日の知識グラフを含む知識ベース推論を研究しています。
  • 知識を手作業で入力するだけでは、大規模なアプリケーションを実現することは困難です。 「  研究期間  「データから知識を要約する研究」であり、その成果には今日のさまざまなデータ分析およびマイニングシステムが含まれています。

「学習」が人工知能の主要な方向性であることが分かります。  機械学習  「トム・ミッチェルの定義によれば、経験からシステムのパフォーマンスを自動的に改善するプロセスです。経験はデータの形で提示されることが多いため、実際には機械学習がデータ分析の主なツールを提供します。つまり、今日のより詳細なデータの分析やモデルを要約する作業はすべて機械学習の範囲に含まれます。」

2. 機械学習タスクの分類

機械学習はデータからモデルを要約しますが、データによって表される経験にはさまざまな形式の情報が含まれる可能性があり、重要な情報の 1 つはモデルのパフォーマンスに関するフィードバックです。一部のデータにはモデルが出力すべき値が含まれており、一部のデータにはこの情報がまったく含まれておらず、一部のデータにはモデルのパフォーマンスのスコアが含まれています。フィードバック情報が異なると、それを処理するために異なるテクノロジーを使用する必要があります。したがって、異なるフィードバック情報に応じて、機械学習は一般的に 3 つのカテゴリに分類されます。

  • 教師あり学習  : モデルの正しい出力値、つまりラベル付きデータを含むプロセスを処理します。たとえば、画像認識データでは、各画像には対応する分類ラベルがあります。
  • 強化学習  :処理されたデータにはモデルのスコア値のみが含まれており、モデルが何を出力すべきかはわかりません。したがって、アルゴリズムに頼って継続的に探索し、最高スコアのモデル出力を見つけることしかできません。たとえば、囲碁では、各手に対する最適なガイダンスが不足しており、スコアを得る唯一の方法は最終的な勝ち負けであり、独自に探索して最適なモデルを見つけることです。
  • 教師なし学習  : データ内のモデル出力の品質を客観的に評価することはまったくできません。このとき、256次元の顔写真を4次元に圧縮するなど、何らかの学習目標を人為的に設定して学習を行うのが一般的です。この時点では、4次元がどのようなものであるべきかについての情報はありません。1つのアプローチは、4次元で256次元の顔を復元できるようにすることです。これは人為的に設定された目標です。このように自分の情報を復元する手法は、自己教師あり学習とも呼ばれます。名前に「教師あり」と付いていますが、実際は教師あり学習の技術を借用した教師なし学習の一種です。

この分類は機械学習のタスク次元に応じて分かれていることがわかります。もちろん、この区分には完全に明確な境界があるわけではありません。学際的な研究がますます発展するにつれて、多くの派生的な方向性が生まれてきました。

  • 教師あり学習×教師なし学習:例えば、データにはラベル付きデータとラベルなしデータが含まれています。ラベルなしデータを使用してモデルのパフォーマンスを向上させる方法の研究は、  半教師あり学習  弱い教師あり学習
  • 教師あり学習×強化学習:例えば、囲碁では人間の達人のデモンストレーションデータがあります。このデータを使って教師あり学習で人間の動きを真似ることができ、AlphaGoの初期バージョンでも使用されていました。このフィールドは 模倣学習
  • 強化学習 × 教師なし学習: たとえば、強化学習タスクではスコアリングが不足しており、アルゴリズムが環境を探索して独自に機能スキルを発見します。

上で述べた機械学習のサブフィールドは、実際には 帰納的学習 つまり、サンプルからルールを要約することです。帰納的学習は、その幅広い適用性により、「デフォルトの機械学習」となっています。しかし、実は機械学習には別のカテゴリが存在します。  演繹的学習 新しい知識を推測することで学習します。この方向性は、データ分析の人気によりこれまであまり注目されていませんでしたが、近年ではシンボリック AI の復活により成長しています。

3. 機械学習のモデル分類

初期の機械学習研究では、次のようなさまざまなインスピレーションに基づいたさまざまなモデルが作成されました。

  • 最近傍モデル
  • 決定木モデル
  • ベイズモデル
  • 線形モデル
  • 多層ニューラルネットワークモデル

など、初期の研究では、1 つの製品 ID が 1 つの製品に対応する、製品を購入したユーザーに関するデータなど、容量が小さく意味レベルが高いデータに主に焦点を当てていました。各ピクセルのグレースケール値で表される画像データなどのより低い意味レベルのデータの場合、画像内の顔を認識するには、グレースケール値と名前との関連を確立する必要があり、これは非常に大きな範囲です。波形で表される音声データの場合、単語を認識するには、音波の強度と単語との一連の関連を確立する必要があり、これは非常に大きな範囲です。そのため、達成されるパフォーマンスには限界があり、顔画像のグレースケールヒストグラム投影など、人工的に構築された高レベルの特徴に頼らなければならないことがよくあります。

2012年、一定の構造を持つ多層ニューラルネットワークモデルが大量のデータと組み合わされ、音声認識と画像認識において性能面での飛躍的な進歩を遂げ、広く注目を集めました。その後、大量の画像や音声データに適用した場合、より多層化されたニューラルネットワークモデルの利点がますます明らかになりました。従来のモデルと区別するために、このタイプのディープニューラルネットワークモデルは ディープラーニング 

その特徴は、特徴エンジニアリング + 従来のモデルとは異なり、ディープモデルは低レベルのセマンティックデータから上位レベルのタスクを直接学習することです。これは、いわゆる「エンドツーエンド」学習であり、データの表現の学習を自動的に含みます。逆に、表現学習を含むモデルでは通常、マルチレベル処理も必要となり、これはディープラーニングとも呼ばれます。ディープニューラルネットワークに加えて、ディープフォレストなどの非ニューラルネットワークモデルも存在します。

非ディープ/ディープ教師あり学習、非ディープ/ディープ強化学習、非ディープ/ディープ教師なし学習など、機械学習のタスクとモデルを組み合わせることができます。

<<:  TiDB v5.1 体験: TiDB で機械学習モデルをトレーニングしました

>>:  デジタル変革時代の産業用ロボットの5つの大きなトレンド

ブログ    

推薦する

将来のシステム設計のための機械学習

エリアス・ファロン氏は、電子設計自動化技術の大手プロバイダーである Cadence Design S...

ドローンの将来の用途

ドローンは、1960年代以降、政府と軍隊によるインテリジェントな戦闘装備の需要から生まれました。米軍...

...

人工知能チュートリアル(II):人工知能の歴史とマトリックスの再考

このシリーズの最初の記事では、人工知能、機械学習、ディープラーニング、データサイエンスなどの分野間の...

R言語におけるAprioriアルゴリズムの応用

[[193979]] I. コンセプト関連性分析は、大規模なデータセットに隠された意味のあるつながり...

...

従来のポートレートプレイヤー向けに AI を新たなレベルに引き上げる方法

これからは、集合写真を撮るときに端に立って歪んでしまうことを心配する必要はありません。現在、このハー...

Google Brain、ロボットアームの把持速度を2倍にする並行RLアルゴリズムを提案

RL アルゴリズムでは通常、観測値の取得、アクションの計算、およびそれらの実行の間で環境の状態が変化...

JS データ構造とアルゴリズム_ソートおよび検索アルゴリズム

序文これは「JavaScript のデータ構造とアルゴリズムを学ぶ」の最後のブログです。これは、面接...

AIがバリアフリー時代へ:手話認識・翻訳の応用が意味するものとは?

人々の印象では、AIは「多数派」に属する技術カテゴリーであると私は信じています。いわゆる多数とは、第...

映画はヒットできるでしょうか?機械学習を使用して正確な予測を行う

映画データベース (TMDB) は映画データ用の API を提供し、ユーザーはこのデータベースからデ...

人工知能がサイバーセキュリティを変える5つの方法

人工知能は、ネットワーク セキュリティの攻撃側と防御側の両方で重要な役割を果たす中立的なテクノロジで...

人工知能(AI)の今後の動向

[[417224]] 21 世紀以降、人工知能は世界中で新たな科学技術革命と産業変革を主導し、人々の...

...

...