人工知能、機械学習、ディープラーニングをどのように区別するのでしょうか?

人工知能、機械学習、ディープラーニングをどのように区別するのでしょうか?

この記事は、LDV Partners のパートナーであるシリコンバレーの投資家レイク・ダイ氏によるものです。真剣に編集してまとめました。

人工知能 (AI) は最も広い概念です。AI の目的は、コンピューターを人間のように考えさせることです。機械学習は、コンピューターが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、パフォーマンスを継続的に向上させる方法を研究することに特化した AI の分野です。

ディープラーニングは、複雑な構造を含むアルゴリズムや、複数の非線形変換で構成される複数の処理層 (ニューラル ネットワーク) を使用して、データに対して高度な抽象化を実行しようとする機械学習手法です。

ニューラル ネットワークは、人間の脳を大まかにモデル化して、パターンを認識するように設計された一連のアルゴリズムです。ニューラル ネットワークは、機械認識システムを通じてセンサー データを解釈し、生の入力のラベル付けやクラスタリングなどの操作を実行できます。ニューラルネットワークが認識できるパターンは数値形式であるため、画像、音声、テキスト、時系列などの現実世界のデータはすべて数値に変換する必要があります。

ディープラーニング ネットワークでは、各層のノードは、前の層の出力に基づいて特定の特徴セットを認識することを学習します。ニューラル ネットワークの深さが増すにつれて、各層が前の層の機能を統合して再結合するため、ノードが認識できる機能はますます複雑になります。

(http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)

上の図は、ニューラル ネットワークを使用して、画像が犬であるかどうかを判断するプロセスを示しています。入力は画像で、犬の低レベルの特徴がディープ ニューラル ネットワークを通じて抽象化されます。最終的な出力は、画像が犬である確率です。

ディープラーニングのプロセスも、トレーニングと推論(つまり「評価」)の 2 つのプロセスに分かれています。データ モデルはトレーニング プロセスを通じて取得され、新しいデータの評価に使用されます。

データ モデルには 2 つの種類があります。1 つはいわゆる識別モデルで、これはモデルを直接使用して物事を識別できることを意味します。ここで物事を判断する最も一般的な方法は分類です。分類に直接使用できるため、既知の属性の条件下でレコードを判断できます。したがって、判別モデルは条件付き確率、つまりp(Y|X)のモデリングです。ここで、X は属性のセットであり、実際にはベクトルです。Y は値 (分類問題に対応) またはベクトル (シーケンス ラベリング問題に対応) になります。識別モデルは、分類問題 (スパムの識別など) や画像認識などの処理によく使用されます。

生成モデルについてお話しましょう。生成モデルは、データを生成するプロセスを記述できます。言い換えれば、モデルがわかれば、そのモデルによって記述されたデータを生成できるということです。データは (X, Y) の 2 つの部分で構成され、前者は特徴であり、後者はカテゴリ (Y はスカラー) またはシーケンス カテゴリ (Y はベクトル) です。データ全体を記述するには、p(X,Y)をモデル化する必要があるため、結合確率をモデル化します。生成モデル自体は分類やシーケンスのラベル付けには使用されませんが、これらの問題を解決するために使用できます。また、チャットボットや AI 音楽作曲などの生成問題にも使用できます。

機械学習は次のカテゴリに分類できます。

  • 教師あり学習では、与えられたトレーニング データ セットから関数を学習し、新しいデータが到着すると、この関数に基づいて結果を予測できます。教師あり学習のトレーニング セットには、入力と出力、または特徴とターゲットが含まれている必要があります。トレーニング データ内のオブジェクトは人間によってラベル付けされます。一般的な教師あり学習アルゴリズムには、回帰分析や統計分類などがあります。
  • 教師あり学習と比較すると、教師なし学習ではトレーニング セットに人間がラベル付けした結果が含まれません。一般的な教師なし学習アルゴリズムはクラスタリングです。
  • 半教師あり学習は、教師あり学習と教師なし学習の中間です。主に、少数のラベル付きサンプルと多数のラベルなしサンプルをトレーニングと分類にどのように使用するかという問題を考慮します。 。
  • 強化学習は、観察を通じてアクションを実行する方法を学習します。それぞれのアクションは環境に影響を与え、学習オブジェクトは周囲の環境から観察されたフィードバックに基づいて判断を下します。

従来の機械学習の分野において、教師あり学習の最大の問題は、トレーニングデータのラベル付けのコストが比較的高いのに対し、教師なし学習の適用範囲が限られていることです。少量のトレーニング サンプルと大量のラベルなしデータを使用する半教師あり学習は、常に機械学習の研究の焦点となってきました。

現在非常に人気のあるディープラーニングのGANモデルは、半教師あり学習の考え方と共通点があります。GANは「Generative Adversarial Networks」の略称で、生成モデルGと識別モデルDを含みます。GANの目的関数はDとGのゼロサムゲームであり、これも最小化問題です。

GAN は実際には生成モデルと識別モデルの間の模倣ゲームです。生成モデルの目的は、実際のデータの分布パターンを可能な限り模倣、モデル化、学習することです。一方、識別モデルの目的は、取得した入力データが実際のデータ分布からのものか、生成モデルからのものかを判断することです。 2 つの内部モデル間の継続的な競争を通じて、2 つのモデルの生成能力と識別能力が向上します。

(Nvidia ディープラーニング トレーニング ワークショップの画像)

現在主流となっているディープラーニングフレームワーク:

  • カフェはバークレーによって提案された
  • Google の TensorFlow (Apache 2.0)
  • Torch(BSDライセンス)、Facebookが主なユーザー
  • MXNetはAmazon AWSで使用されている比較的中立的な機械学習フレームワーク(Apache 2.0)です。
  • Microsoft による CNTK2 (MIT ライセンス)

さまざまな業界で人工知能を活用している企業の分布

(画像出典: http://www.shivonzilis.com/)

各分野におけるAIスタートアップの現在の数(2016年のデータ):

  • ディープラーニング・機械学習(一般)(123社)
  • ディープラーニング・機械学習(応用)(260社)
  • NLP(一般)(154社)
  • NLP(音声認識)(78社)
  • コンピュータビジョン/画像認識(一般)(106社)
  • コンピュータビジョン/画像認識(アプリケーション)(83社)
  • ジェスチャーコントロール(33社)
  • バーチャルパーソナルアシスタント(92社)
  • 知能ロボット(65社)
  • レコメンデーションシステム(60社)
  • コンテキストアウェアコンピューティング(28社)
  • 音声翻訳(15社)
  • 動画認識(14社)

次の図は、さまざまな業界における人工知能の現在の人気を示しています。

上のグラフは、2011年から2016年にかけて人工知能企業に最も積極的に投資した投資家を示しています。

次の図は、Forbes が注目する 50 社の人工知能企業を示しています。

(画像: http://fortune.com/2017/02/23/artificial-intelligence-companies/ より)

最も資金提供を受けた AI スタートアップ (2011-2016)

Sentient Technologies: 高度な人工知能技術、大規模分散コンピューティング、科学的手法を使用して新たに発見された戦略を検証し、Sentient Technologies はさまざまな分野の複雑な問題に対する新しいソリューションを提供します。

Ayasdi: 機械学習プラットフォーム、データ可視化、分析、金融テクノロジー、ヘルスケアエージェントシステム:

Vicarious: これは謎の人工知能会社です。Vicarious の目標は「次世代の人工知能アルゴリズムを構築すること」です。また、同社は「人間のように考えるソフトウェア」を構築し、「人間レベルの視覚、言語、自動制御システム」を実現すると主張している。同社は汎用人工知能の研究に注力しており、現在は人工視覚認識システムの実現に注力している。

Context Relevant: Context Relevant は、機械学習を活用した自動化されたデータ サイエンス プラットフォームを使用して、他のどのソリューションよりも迅速かつ効果的に、世界で最も困難なビッグ データ、予測、行動の課題の一部を解決します。

Cortia: Cortica のテクノロジーは人間の大脳皮質をシミュレートし、これまでにない精度で画像を理解および認識します。

Workfusion: WorkFusion は、ビジネス プロセス管理 (BPM)、ロボティック プロセス自動化 (RPA)、ワークフォース オーケストレーション、機械学習を活用した認知自動化など、複雑なビジネス プロセスをデジタル化するために必要なコア機能を 1 つのプラットフォームに統合した、グローバル オペレーション向けの完全な自動化ソリューションです。

RapidMiner: 企業がビジネスプロセスに予測分析を組み込むことを可能にするオープンソースの予測分析プラットフォーム

デジタル推論システム: コンプライアンスを確保し、セキュリティを維持し、情報を迅速かつ正確に分析します。

H2O.ai: H2O は世界をリードするオープンソースのディープラーニング プラットフォームです。 H2O は、80,000 人を超えるデータ サイエンティストと 9,000 を超える組織で使用されています。

Viv Labs: Viv は音声起動型スマートアシスタントを開発しており、Samsung に買収されました。

参考文献:

http://fortune.com/ai-artificial-intelligence-deep-machine-learning/

https://en.wikipedia.org/wiki/人工ニューラルネットワーク

http://fortune.com/2017/02/23/artificial-intelligence-companies/

https://www.amazon.com/b?ie=UTF8&node=16008589011#

http://techemergence.com/artificial-intelligence-industry-an-overview-by-segment/

Nvidia ディープラーニング トレーニング ワークショップ

クランチベース

CBインサイト



<<:  顔認識の専門家、王国天氏:人工知能、機械学習、機械視覚とは何ですか?

>>:  ロボットが家庭に入り込み、家事を引き受け始めています。あなたのお気に入りはどれですか?

ブログ    
ブログ    

推薦する

最先端の洞察 | ドローン配達が紛失しない理由はここにあります!

Frontier Insights の今号では、ドローンが商品を配送する際に進路を見つけやすくする...

AI人工知能は研究室から生産現場へと進出したが、依然として大きな課題に直面している。

国内企業におけるAI導入の現状アクセンチュアが世界各国の企業幹部を対象に実施した「中国企業はどのよう...

中国の良き叔父から12歳の開発者Jing Kunまで:DuerOSはすべての開発者に平等に力を与えます

スマート音声開発者はAIの「ゴールドラッシュ」を先導しています。 7月4日、第2回百度AI開発者会議...

視覚的な「脳の読み取り」:脳の活動から見える世界を再構築する

人間の知覚は客観的な刺激だけでなく過去の経験によっても形成され、それらが組み合わさって脳内で複雑な活...

アルゴリズム王国では中国が他国を追い抜くかもしれない

今年の初め、世界中で人工知能の発展に注目していた人たちの注目を集めた出来事が2つありました。一つは、...

1 つの記事で機械学習を理解する: 基本概念、5 つの主要な流派、9 つの一般的なアルゴリズム

1. 機械学習の概要 1. 機械学習とは何ですか?機械は大量のデータを分析して学習します。たとえば...

...

...

...

機械学習に必須の Python ライブラリ トップ 10

[51CTO.com クイック翻訳] 現在、Python は人気があり広く使用されているプログラミ...

...

香港大学のチームがエンタングルメントエントロピーを測定する新しいアルゴリズムを開発、量子材料の実用化に一歩近づく

量子材料は人類の進歩を促進する上で重要な役割を果たします。科学技術分野では、特殊な特性を持つ新たな量...

深層強化学習について知っておくべきこと

[51CTO.com クイック翻訳] 現在、機械学習(ML)と人工知能(AI)に関連するアルゴリズム...

人工知能は労働力不足の重要な解決策とみられる

セリディアンは、無限の労働力を動員する力に焦点を当てた年次経営者調査の結果を発表しました。調査では、...

データセットと DataLoader を使用して PyTorch でデータをカスタマイズする

大規模なデータセットを扱う場合、データ全体を一度にメモリにロードすることが非常に困難になることがあり...