機械学習、人工知能、ディープラーニングの関係は何ですか?ついに誰かが明らかにした

機械学習、人工知能、ディープラーニングの関係は何ですか?ついに誰かが明らかにした

「機械学習」、「人工知能」、「ディープラーニング」という 3 つの用語は混同されることが多いですが、実際には、これらは非常に離れた時期に登場しました。「人工知能」(AI) は 1950 年代に登場し、「機械学習」(ML) は 1980 年代に登場し、「ディープラーニング」(DL) は近年になって登場しました。図1-1に示すように、3つは包含と包含される関係にあります。

▲図1-1 人工知能、機械学習、ディープラーニングの関係

上記の関係については、業界内でもさまざまな見解があります。たとえば、ディープラーニングの一部の側面は機械学習の範囲外であると考える人もいますが、ここでは取り上げません。

01 機械学習と人工知能

「人工知能」という用語は、1956年のダートマス会議で登場しました。当時、人工知能の先駆者たちの夢は、人間の知能を備えたソフトウェアとハ​​ードウェアのシステムを構築することでした。そのシステムは人間の知能の特徴を備えており、ここで言及されている人工知能は「汎用人工知能」でした。

こうした人工知能の夢は、映画「スターウォーズ」に登場する人間並みの理性や思考力を持つロボット「C-3PO」など、映画やテレビ作品でも輝いています。しかし、現時点では、こうした高度な推論や思考を実現するのは依然として困難です。次善の策として、現在実装できるのは顔認識などの「狭義の人工知能」ばかりです。

機械学習を人工知能への方法論的アプローチとして説明します。機械学習とは、既存のデータ、知識、または経験に基づいて意味のあるパターンを自動的に識別することです。最も基本的な意味では、機械学習はアルゴリズムを使用してデータを解釈し、データから学習し、同様のコンテキストで決定や予測を行います。つまり、データに基づいて学習し、意思決定を行うことを意味します。この説明は、機械学習を従来のソフトウェアや通常のプログラムと区別します。

機械学習プロセスでは、機械学習システムが未知の環境についてどのように決定または予測を行うべきかについて、人間による指示はありません。このプロセスは、機械学習アルゴリズムによってデータから学習されます。意思決定主体は機械学習アルゴリズムであり、決定または予測は非決定論的な結果であり、通常は晴れの確率が 80% などの確率の形で出力されます。

対照的に、従来のアプリケーションでは、ソフトウェア エンジニアが、登録の成功と失敗をそれぞれ示すために 0 と 1 を出力するなど、プログラムまたはソフトウェアに特定の動作を実行するように指示するコード (特定の命令セット) を 1 つずつ記述する必要があります。決定を下す主体は実際には人間であり、プログラムはアクションを実行するための単なるツールです。このため、機械学習は従来のプログラミングとは対照的に、間接プログラミングとして分類できます。

[[360923]]

02 機械学習とディープラーニング

ディープラーニングでは、多層(通常 5 層以上)の人工ニューラル ネットワークを使用して、データ内の複雑な関係を学習します。人工ニューラル ネットワークは、生物学、認知科学、人工知能の組み合わせの産物です。初期の機械学習で使用されてきました。当初の目的は、コンピューターで人間の脳のニューロンの動作モードをシミュレートすることでした。

人間の脳には数百億のニューロンがあり、シナプスを通じて互いに通信しますが、これは計算の観点から見ると膨大な計算量です。そのため、実際には複雑な人工ニューラル ネットワークの応用には限界があります。コンピュータの計算能力の大幅な向上は、新たな可能性をもたらしました。2000年、トロント大学のジェフリー・ヒントン率いる研究チームは、たゆまぬ研究の末、ついに現代のスーパーコンピュータにおけるディープラーニングの多層ネットワーク構造を検証しました。

ジェフリー・ヒントンは、ディープラーニングの分野における多大な貢献によりディープラーニングの創始者として知られており、ヨシュア・ベンジオ、ヤン・ルカンとともに機械学習の三大巨頭の一人として知られています。 (3人はディープラーニングへの貢献により2018年のチューリング賞を受賞しました。

ディープラーニングは、機械学習のサブセットである機械学習を実装するための技術として考えることができます。ディープラーニングとは対照的に、以前は単一層または数層のみのニューラルネットワークは、浅い学習と呼ばれていました。

専門家の中には、ある現象を説明するために、機械学習を冗談交じりに説明する人もいます。資金調達のときは人工知能に属し、採用のときは機械学習に属し、実行のときは線形回帰に属し、デバッグのときは printf() に属します。

上記は、人工知能、機械学習、ディープラーニングの関係を一面から簡単に説明したものです。より包括的な情報については、関連資料を参照してください。

[[360924]]

03 機械学習と統計、ビッグデータとデータサイエンス

機械学習は従来の統計学と切り離せないものであり、どちらもデータから結論を導き出すことが含まれます。統計学では、データ空間の仮定(例えば、データは正規分布している)の下でパラメトリックな解法が最初に提案されましたが、サンプルサイズが無限に増加した場合の統計的推定値の収束に関心がありました。機械学習では、データ分布に関する仮定をできるだけ少なくし、有限サンプルでの学習のパフォーマンス(アルゴリズムとモデルの性能)に注目しながら、データ生成に近いモデルを学習するためのアルゴリズムをキーとして使用します。

機械学習とビッグデータは、同じ文脈で登場することがよくあります。誰かがビッグデータについて言及したとき、その人がビッグデータで何を意味しているのかを理解するためには、その人の背景を見る必要があります。

この人がビッグデータ関連の技術者であり、技術的な観点からビッグデータを説明する場合、データの保存、分析、処理、計算の技術を指すことが多い。難しさは特定のアルゴリズムにあるのではなく、保存と計算の分散システムの階層的な問題にある。業界では、大量のデータをモデル化するために比較的単純なアルゴリズムが使用されることが多いこともわかります。

逆に、データ量が少ない場合は、入手が困難なため、詳細な分析や処理が必要になる場合が多くあります。ある日の天気に基づいて別の日の天気を推測することは困難ですが、過去の天気データが大量にある場合は、従来のアルゴリズムを使用して別の日の天気をより自信を持って推測できます。

ある意味、「ビッグデータは難しくないが、スモールデータが難しい」という言葉にはある程度の真実が含まれています。この人がビジネスの観点からビッグデータを説明する場合、多くの場合、データ、データ分析、マイニング、運用、ビジネス価値の創出に基づく方法と戦略について言及します。

一般人がビッグデータについて話すとき、彼らは大量のデータ、セキュリティ、プライバシーなどのより直感的な概念を指すことが多いです。多くのシナリオでは、実際にアルゴリズム モデルに入力されるデータの量について、「本当にビッグ データがあるのだろうか?」と自問する必要があることに言及する価値があります。

もちろん、機械学習に使用されるデータはさまざまなチャネルから取得され、データ量は膨大で、ビッグデータ プラットフォームまたはビッグデータ ストレージ システムに保存されます。この観点から見ると、機械学習はビッグデータに依存しています。さらに、ビッグデータ(およびその処理能力)は、従来のデータ分析モデリングを機械学習やディープラーニングに変革するための鍵でもあります。

機械学習はデータサイエンスとも密接に関連しています。データサイエンスは、データに関する活動をデータの観点からまとめたもので、機械学習よりも範囲が広いと私は考えています。データ エンジニアリング、データ視覚化、データ統合と ETL (抽出、変換、ロード)、ビジネス インテリジェンス、データ製品、ビッグ データなどはすべてデータ サイエンスに分類できます。

<<:  大好きです!初心者に適した 7 つの高品質 AI プロジェクト

>>:  機械学習を推奨するマーケティング アカウントが増えています。これは本当に信頼できるのでしょうか?

ブログ    
ブログ    

推薦する

...

人工知能が地震監視を新たな時代へ導く

[[388691]]被害の程度を軽減することは地震研究者にとって重要な目標です。破壊的な地震が発生し...

半教師あり学習とその応用シナリオの簡単な分析

ラボガイドインターネットの発展により、企業はより多くのデータを入手できるようになりました。これらのデ...

LoraHubはレゴのように組み立てることができ、LoRAのモジュール特性を探索することができます。

低ランク適応 (LoRA) は、基本的な LLM が特定のタスクに効率的に適応できるようにする、一般...

...

...

AIがマーケティングオーディエンスの洞察をどのように変えるのか

[[429813]]人工知能は、企業のマーケティング範囲の拡大に大きく貢献することが証明されています...

人工知能は生産と生活の変革を加速させる

[[399011]]飛行機に搭乗するための「顔スキャン」、歩行者を積極的に識別して回避する自動運転車...

近い将来、人工知能によって劇的に変化する11の業界

人工知能(AI)は急速に、そしてシームレスに生活の一部となったため、私たちの多くは、それが社会にどれ...

相関ルール推奨アルゴリズムの原理と実装

相関ルールは、データ間の潜在的な関連性を発見するために使用されます。最も一般的なアプリケーションは、...

TensorFlow 2.0「開発者プレビュー」が利用可能になりました

TensorFlow 2.0 プレビューが利用可能になりました。最近、Google AI チームのメ...

...

600以上のベーキングレシピを分析し、機械学習を使用して新製品を開発しました

焼き菓子は、世界中のさまざまな料理の中で常に重要な位置を占めてきました。柔らかいパン、繊細なケーキ、...

...