機械学習、ディープラーニング、強化学習の関係と違いは何ですか?

機械学習、ディープラーニング、強化学習の関係と違いは何ですか?

これには、機械学習のサブフィールドの分類が含まれます。すべての分類において、最初に尋ねるべき質問は、なぜそのように分けられているのかということです。どの次元で分割されますか?論理的な分類は人々の認知的枠組みを確立するのに役立ちますが、非論理的な分類は人々を混乱させる可能性があります。

1. 機械学習は人工知能のサブフィールドである

人工知能のサブフィールドは、歴史を通じて発展してきたため、比較的明確な特徴を持っています。大まかに分けると以下のようになります。

  •  推論期間  ”:自動定理証明やチェスシステムDeepBlueを含む検索に関する研究
  • 単に推論できるだけでは、幅広い知識を必要とする実践的な問題に対処することはできません。 「  知識期間  」、Prolog、さまざまなエキスパートシステム、今日の知識グラフを含む知識ベース推論を研究しています。
  • 知識を手作業で入力するだけでは、大規模なアプリケーションを実現することは困難です。 「  研究期間  「データから知識を要約する研究」であり、その成果には今日のさまざまなデータ分析およびマイニングシステムが含まれています。

「学習」が人工知能の主要な方向性であることが分かります。  機械学習  「トム・ミッチェルの定義によれば、経験からシステムのパフォーマンスを自動的に改善するプロセスです。経験はデータの形で提示されることが多いため、実際には機械学習がデータ分析の主なツールを提供します。つまり、今日のより詳細なデータの分析やモデルを要約する作業はすべて機械学習の範囲に含まれます。」

2. 機械学習タスクの分類

機械学習はデータからモデルを要約しますが、データによって表される経験にはさまざまな形式の情報が含まれる可能性があり、重要な情報の 1 つはモデルのパフォーマンスに関するフィードバックです。一部のデータにはモデルが出力すべき値が含まれており、一部のデータにはこの情報がまったく含まれておらず、一部のデータにはモデルのパフォーマンスのスコアが含まれています。フィードバック情報が異なると、それを処理するために異なるテクノロジーを使用する必要があります。したがって、異なるフィードバック情報に応じて、機械学習は一般的に 3 つのカテゴリに分類されます。

  • 教師あり学習  : モデルの正しい出力値、つまりラベル付きデータを含むプロセスを処理します。たとえば、画像認識データでは、各画像には対応する分類ラベルがあります。
  • 強化学習  :処理されたデータにはモデルのスコア値のみが含まれており、モデルが何を出力すべきかはわかりません。したがって、アルゴリズムに頼って継続的に探索し、最高スコアのモデル出力を見つけることしかできません。たとえば、囲碁では、各手に対する最適なガイダンスが不足しており、スコアを得る唯一の方法は最終的な勝ち負けであり、独自に探索して最適なモデルを見つけることです。
  • 教師なし学習  : データ内のモデル出力の品質を客観的に評価することはまったくできません。このとき、256次元の顔写真を4次元に圧縮するなど、何らかの学習目標を人為的に設定して学習を行うのが一般的です。この時点では、4次元がどのようなものであるべきかについての情報はありません。1つのアプローチは、4次元で256次元の顔を復元できるようにすることです。これは人為的に設定された目標です。このように自分の情報を復元する手法は、自己教師あり学習とも呼ばれます。名前に「教師あり」と付いていますが、実際は教師あり学習の技術を借用した教師なし学習の一種です。

この分類は機械学習のタスク次元に応じて分かれていることがわかります。もちろん、この区分には完全に明確な境界があるわけではありません。学際的な研究がますます発展するにつれて、多くの派生的な方向性が生まれてきました。

  • 教師あり学習×教師なし学習:例えば、データにはラベル付きデータとラベルなしデータが含まれています。ラベルなしデータを使用してモデルのパフォーマンスを向上させる方法の研究は、  半教師あり学習  弱い教師あり学習
  • 教師あり学習×強化学習:例えば、囲碁では人間の達人のデモンストレーションデータがあります。このデータを使って教師あり学習で人間の動きを真似ることができ、AlphaGoの初期バージョンでも使用されていました。このフィールドは 模倣学習
  • 強化学習 × 教師なし学習: たとえば、強化学習タスクではスコアリングが不足しており、アルゴリズムが環境を探索して独自に機能スキルを発見します。

上で述べた機械学習のサブフィールドは、実際には 帰納的学習 つまり、サンプルからルールを要約することです。帰納的学習は、その幅広い適用性により、「デフォルトの機械学習」となっています。しかし、実は機械学習には別のカテゴリが存在します。  演繹的学習 新しい知識を推測することで学習します。この方向性は、データ分析の人気によりこれまであまり注目されていませんでしたが、近年ではシンボリック AI の復活により成長しています。

3. 機械学習のモデル分類

初期の機械学習研究では、次のようなさまざまなインスピレーションに基づいたさまざまなモデルが作成されました。

  • 最近傍モデル
  • 決定木モデル
  • ベイズモデル
  • 線形モデル
  • 多層ニューラルネットワークモデル

など、初期の研究では、1 つの製品 ID が 1 つの製品に対応する、製品を購入したユーザーに関するデータなど、容量が小さく意味レベルが高いデータに主に焦点を当てていました。各ピクセルのグレースケール値で表される画像データなどのより低い意味レベルのデータの場合、画像内の顔を認識するには、グレースケール値と名前との関連を確立する必要があり、これは非常に大きな範囲です。波形で表される音声データの場合、単語を認識するには、音波の強度と単語との一連の関連を確立する必要があり、これは非常に大きな範囲です。そのため、達成されるパフォーマンスには限界があり、顔画像のグレースケールヒストグラム投影など、人工的に構築された高レベルの特徴に頼らなければならないことがよくあります。

2012年、一定の構造を持つ多層ニューラルネットワークモデルが大量のデータと組み合わされ、音声認識と画像認識において性能面での飛躍的な進歩を遂げ、広く注目を集めました。その後、大量の画像や音声データに適用した場合、より多層化されたニューラルネットワークモデルの利点がますます明らかになりました。従来のモデルと区別するために、このタイプのディープニューラルネットワークモデルは ディープラーニング 

その特徴は、特徴エンジニアリング + 従来のモデルとは異なり、ディープモデルは低レベルのセマンティックデータから上位レベルのタスクを直接学習することです。これは、いわゆる「エンドツーエンド」学習であり、データの表現の学習を自動的に含みます。逆に、表現学習を含むモデルでは通常、マルチレベル処理も必要となり、これはディープラーニングとも呼ばれます。ディープニューラルネットワークに加えて、ディープフォレストなどの非ニューラルネットワークモデルも存在します。

非ディープ/ディープ教師あり学習、非ディープ/ディープ強化学習、非ディープ/ディープ教師なし学習など、機械学習のタスクとモデルを組み合わせることができます。

<<:  TiDB v5.1 体験: TiDB で機械学習モデルをトレーニングしました

>>:  デジタル変革時代の産業用ロボットの5つの大きなトレンド

ブログ    
ブログ    
ブログ    

推薦する

DxRアルゴリズムのアイデアに基づいて設計されたルーティングアイテム配置構造の図

まず、タイトルには、検索構造ではなく、ルーティング項目の配置構造と書かれています。つまり、この構造を...

自動運転シミュレーションテスト技術は実際の街頭シーンをシミュレートできる

[[262014]]自動運転は近年注目されている研究開発プロジェクトです。市場に投入される前にシミュ...

ドイツ企業の47%は、人工知能の最大の利点は生産効率の向上であると考えている。

ドイツ連邦政府は2018年に「ドイツ人工知能開発戦略」を発表し、人工知能分野におけるドイツの研究開発...

世界トップ10のAIトレーニングチップの包括的なレビュー

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

イーブンテクノロジーは、AIアプリケーションシナリオに沿った新世代のデータウェアハウスを構築します。

[51CTO.com からのオリジナル記事] 今日の情報化社会には、さまざまな情報リソースが溢れて...

上海の疫病対策において人工知能は何を果たしたのか?

4月8日、「上海デジタル変革リーディンググループオフィス」が主導し、上海スマートシティ発展研究所が...

...

AIが建物の快適性に革命を起こす

商業ビルでは、顧客と居住者の快適性がポジティブな体験を保証するために重要です。快適さの重要な要素は、...

最終支払いを控える人々のダブル11不安:配達ロボットは解決できるか?

今年のダブル11のクライマックスが終わり、最後の支払いをしなければならなかった人たちも、速達を待つ苦...

PaddleOCRのスーパーパワーを解き放つ

光学文字認識 (OCR) は、機械が画像やスキャンされた文書からテキストを認識して抽出できるようにす...

人工知能の65年の簡単な歴史:マッカーシーからヒントンまで、人類はどのようなAIを追求しているのでしょうか?

人工知能の発展は65年の歴史があり、厳しい冬も栄光も経験してきました。シンボリックエキスパートシステ...

Spring Boot 3.2フレームワークはほぼ完成、VMWareは利用が大幅に増加したと主張

ティム・アンダーソン編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:...

サンダーソフト、AIoT産業・大学・研究のボトルネックを打破するTurboX AI Kit教育実験プラットフォームをリリース

10月12日、世界をリードするインテリジェントオペレーティングシステム製品およびテクノロジープロバイ...