ディープラーニングと機械学習の違いを理解する

機械学習とディープラーニングの違いは何だろうとよく疑問に思う方は、この記事を読んで、その違いを一般の人にもわかる言葉で説明してください。

機械学習とディープラーニングはますます人気が高まっています。突然、誰もが、知っていたかどうかに関わらず、機械学習とディープラーニングについて話すようになりました。データサイエンスに積極的に注目しているかどうかにかかわらず、おそらくこれらの 2 つの用語を聞いたことがあるでしょう。

どれほど人気があるのかを示すために、Google トレンドで次のキーワードを検索しました。

機械学習とディープラーニングの違いを自分なりに明確にしたい場合は、この記事を読んでください。わかりやすい言葉でその違いを紹介します。機械学習とディープラーニングで使われる用語について詳しく説明します。さらに、それらの違いを比較し、それぞれの使用シナリオについて説明しました。

機械学習とディープラーニングとは何ですか?

まずは基本から始めましょう。機械学習とディープラーニングとは何でしょうか? すでにご存知の場合は、このセクションを飛ばしてください。

機械学習とは何ですか?

一言で言えば、広く引用されているトム・ミッチェルによる機械学習の定義が最も適切な説明を与えています。内容は次のとおりです:

「コンピュータプログラムは、ある種のタスク T とパフォーマンス測定基準 P が与えられた場合、経験 E から学習できます。タスク T でのパフォーマンスが P で測定できる場合、経験 E によってパフォーマンスが向上します。」

わかりにくいですか? 簡単な例を使ってこの説明を分解してみましょう。

例 1: 機械学習と身長に基づく体重の推定

身長に基づいて人の体重を推定できるシステムを作成したいとします (おそらく、何らかの理由でこれに興味があるのでしょう)。次に、機械学習を使用して、データキャプチャにおける可能性のあるエラーや間違いを見つけることができます。まず、データを収集する必要があります。データがどのようなものかを見てみましょう。

グラフの各ポイントはデータポイントに対応しています。単純な対角線を描くことで、身長に基づいて体重を予測できます。

たとえば、このスラッシュ:

体重（ kg ）＝身長（ cm ）-100

...これらの傾斜は予測に役立ちます。これらの傾斜は素晴らしいものですが、その仕組みを理解する必要があります。予測と実際の間の誤差を減らし、パフォーマンスを測定する必要があります。

もっと広い意味では、収集するデータ（経験）が多ければ多いほど、モデルはより良くなります。さらに変数（性別など）を追加したり、異なる予測子の傾きを追加したりすることで、モデルを改良することもできます。

例2: ハリケーン予測システム

もっと複雑な例を見てみましょう。ハリケーン予測システムを構築したいとします。過去のすべてのハリケーンに関するデータと、このハリケーン以前の 3 か月間の気象情報があるとします。

ハリケーン予測システムを手動で構築するとしたら、どのようにすればよいでしょうか?

まず第一に、私たちの仕事は、すべてのデータをクリーニングしてデータ内のパターンを見つけ、次にハリケーンの形成条件を見つけることです。

モデル条件データ (温度 40 度以上、湿度 80 ～ 100 など) をシステムに入力して出力を生成することも、これらの条件データを使用してシステムに適切な出力を生成させることもできます。

過去のデータをすべてシステムに入力すれば、将来ハリケーンが発生するかどうかを予測できます。システム条件の値に基づいて、システムのパフォーマンス（システムが正しく予測したハリケーンの数）を評価します。システムの予測結果をフィードバックとして使用して、上記の手順を複数回繰り返し続けることができます。

これまでの説明に基づいて予測システムを定義してみましょう。私たちの仕事は、ハリケーンを発生させる可能性のある気象条件を判断することです。パフォーマンス P は、与えられたすべての条件を前提としてシステムがハリケーンを正しく予測した回数です。経験 E はシステムの反復回数です。

ディープラーニングとは何ですか?

ディープラーニングの概念は新しいものではありません。それは数年前から存在しています。しかし、世の中にはさまざまな誇大宣伝があり、ディープラーニングはますます注目を集めています。機械学習の場合と同様に、まずディープラーニングの公式定義を見てから、例を挙げて説明しましょう。

「ディープラーニングは、世界を概念のネストされた階層として表現することを学習することで、非常に大きなパワーと柔軟性を実現する特別な種類の機械学習です。各概念はより単純な概念との関連性に基づいて定義され、より抽象的な表現はより抽象度の低い概念に基づいて計算されます。」

これも少し混乱します。簡単な例を使ってこの概念を分解してみましょう。

例1: 形状検出

概念レベルで何が起こっているかを説明するために、簡単な例から始めましょう。正方形を他の図形と区別する方法を見てみましょう。

最初に確認するのは、グラフに 4 本の線があるかどうかです (単純な概念)。このような 4 本の線が見つかった場合は、それらが互いに接続され、閉じていて、垂直であり、等しいことをさらに確認します (ネストされた概念階層)。

そこで、私たちは複雑なタスク（正方形を認識する）を、より単純で抽象度の低いタスクの形で完了させました。ディープラーニングは本質的に、同様のロジックを大規模に実行します。

例2: 猫と犬

動物認識の例を見てみましょう。この例では、システムは、与えられた画像内の動物が猫か犬かを識別する必要があります。

機械学習とディープラーニングの比較

機械学習とディープラーニングについて理解できたので、いくつかの重要なポイントを学び、2 つのテクノロジーを比較してみましょう。

データ依存性

ディープラーニングと従来の機械学習の主な違いは、データのサイズが大きくなるにつれてパフォーマンスが向上することです。ディープラーニングアルゴリズムは、データが少ない場合にはうまく機能しません。これは、ディープラーニングアルゴリズムを完全に理解するには大量のデータが必要になるためです。一方、この場合、従来の機械学習アルゴリズムは定式化されたルールを使用し、より優れたパフォーマンスを発揮します。次の図はこの事実をまとめたものです。

ハードウェア依存性

ディープラーニングアルゴリズムには、多数の行列演算が必要です。GPU は主に行列演算を効率的に最適化するために使用されるため、ディープラーニングが適切に機能するためには GPU が不可欠なハードウェアです。従来の機械学習アルゴリズムと比較すると、ディープラーニングは GPU を搭載したハイエンドマシンに大きく依存します。

特徴処理

特徴処理とは、ドメイン知識を特徴抽出器に組み込んでデータの複雑さを軽減し、学習アルゴリズムを機能させるより優れたパターンを生成するプロセスです。機能処理プロセスには時間がかかり、専門知識が必要です。

機械学習では、ほとんどのアプリケーションの機能は専門家によって決定され、データ型としてエンコードされる必要があります。

特徴としては、ピクセル値、形状、テクスチャ、位置、方向などがあります。ほとんどの機械学習アルゴリズムのパフォーマンスは、抽出された特徴の精度に依存します。

ディープラーニングはデータから直接高レベルの特徴を取得しようとします。これがディープラーニングと従来の機械学習アルゴリズムの主な違いです。これに基づいて、ディープラーニングは各問題に対する特徴抽出器を設計する作業を削減します。たとえば、畳み込みニューラルネットワークは、初期の層で低レベルの特徴 (境界、線) を学習し、次に顔の各部分を学習し、最後に顔の高レベルの説明を学習しようとします。詳細については、「ディープラーニングにおけるニューラルネットワーク機械学習の興味深いアプリケーション」をお読みください。

問題解決方法

従来の機械学習アルゴリズムを問題の解決に適用する場合、従来の機械学習では通常、問題を複数のサブ問題に分割して 1 つずつ解決し、すべてのサブ問題の結果を組み合わせて最終結果を取得します。対照的に、ディープラーニングはエンドツーエンドの直接的な問題解決を提唱しています。

例えば：

画像内のオブジェクトの種類と、画像内の各オブジェクトの位置を必要とする複数オブジェクト検出タスクがあるとします。

従来の機械学習では、問題をオブジェクト検出とオブジェクト認識の 2 つのステップに分割します。まず、境界ボックス検出アルゴリズムを使用して画像全体をスキャンし、オブジェクトである可能性のある領域を見つけます。次に、オブジェクト認識アルゴリズム (HOG と組み合わせた SVM など) を使用して、前の手順で検出されたオブジェクトを識別します。

対照的に、ディープラーニングは入力データを直接操作して出力結果を取得します。たとえば、画像を YOLO ネットワーク (ディープラーニングアルゴリズム) に直接渡すと、YOLO ネットワークが画像内のオブジェクトと名前を付与します。

実行時間

通常、ディープラーニングアルゴリズムのトレーニングには長い時間がかかります。これは、ディープラーニングアルゴリズムには多くのパラメーターがあるため、アルゴリズムのトレーニングに時間がかかるためです。最も高度なディープラーニングアルゴリズム ResNet を完全にトレーニングするには 2 週間かかりますが、機械学習のトレーニングには比較的短い時間、数秒から数時間しかかかりません。

しかし、2つのテストのタイミングは完全に逆です。ディープラーニングアルゴリズムは、テスト時に実行するのに非常に短い時間しかかかりません。 k近傍法（機械学習アルゴリズム）と比較すると、データ量が増えるにつれてテスト時間も長くなります。ただし、これはすべての機械学習アルゴリズムに当てはまるわけではなく、一部の機械学習アルゴリズムではテスト時間が短いものもあります。

説明可能性

重要なのは、機械学習とディープラーニングを比較する際の要素として解釈可能性を考慮することです。

例を見てみましょう。ディープラーニングを適用して記事を自動的に評価するとします。ディープラーニングは人間に近いパフォーマンスを実現できるので、非常に驚異的です。しかし、まだ問題が残っています。ディープラーニングアルゴリズムでは、なぜそのスコアが付けられたのかはわかりません。もちろん、数学的には、どのディープニューラルネットワークノードがアクティブ化されているかを調べることができます。しかし、ニューロンのモデルがどうあるべきか、また、これらのニューロンユニットの層が集合的に何をすべきかはわかっていません。したがって、結果がどのように生成されたかを説明することは不可能です。

一方、決定木などの機械学習アルゴリズムは、アルゴリズムがなぜその選択を行ったのかを説明する明確なルールを提供するため、決定の背後にある理由を説明するのは簡単です。したがって、業界では解釈可能性のために、決定木や線形/ロジスティック回帰などのアルゴリズムが主に使用されています。

<<: 分析: 機械学習を妨げる 10 のサイバー攻撃とは?

>>: 2017 年に最も価値のある機械学習のスキルや知識は何ですか?

Google、Amazon、Microsoft – 人工知能の競争をリードするのは誰か？

ブログ

ChatGPTはPyTorchなしでは構築できません。LeCunの発言は白熱した議論を引き起こしました。モデルメーカーが重量を公開しない理由は、

ブログ

Gizwits Cloud はスマートホームが機械にユーザーをよりよく理解するのを助けます

ディープラーニングと機械学習の違いを理解する

Google、Amazon、Microsoft – 人工知能の競争をリードするのは誰か？

ChatGPTはPyTorchなしでは構築できません。LeCunの発言は白熱した議論を引き起こしました。モデルメーカーが重量を公開しない理由は、

Gizwits Cloud はスマートホームが機械にユーザーをよりよく理解するのを助けます

機械学習が通信業界にもたらすメリット

高校時代の位相除算と位相減算のアルゴリズムについて

OpenAIがChatGPTをアップデート：画像と音声入力をサポート

ゴリラもMinecraftをプレイできるようになり、動画を一度見るだけで新しいスキルが手に入る

推薦する

7つの文章でAIが私のために小さなゲーム、ゼルダのミニマリストバージョンを作成し、私はそれをプレイするのをやめることができませんでした

エッジAIを活用してオフィスビルの適応性と効率性を向上させる方法

世界最大の公開顔データセット | 清華大学と信義科技が共同リリース

AIユニコーンがIPOに群がり、資本市場を刺激。シナリオアプリケーションは複数の場所で爆発的に増加する可能性がある

MITが「計算能力」に関する警告を発令：ディープラーニングは計算能力の限界に近づいている

データとAIが現代の人事慣行をどのように変えているのか

潜入捜査官のふりをして、AI を騙してコードを漏らさせて人類を救うつもりですか? スタンフォード大学の学生がGPT-4を使ってゲームを開発し、ネットユーザーを驚かせた

ダンスをしたり、音楽を作曲したり、演出したりできる AI を見たことがありますか?

Python でシンプルなニューラルネットワークを作成する方法 (コード付き)

Google がオールラウンドな音楽転写 AI を発表: 曲を一度聴くだけでピアノとバイオリンの楽譜がすべて手に入る

ABIリサーチ：ドローン市場は2030年までに920億ドル規模に