機械学習の基本概念を10枚の画像で説明する

機械学習の基本概念を10枚の画像で説明する

機械学習の基本的な概念を説明するとき、私はいつも限られた数の図に戻ってしまいます。以下は、私が最も啓発されたと思ったエントリーのリストです。

テストとトレーニングのエラー

トレーニング エラーが低いことが必ずしも良いことではない理由: 上の図は、モデルの複雑さを変数とするテストおよびトレーニング エラー関数を示しています。

過小適合と過剰適合

アンダーフィッティングまたはオーバーフィッティングの例。上の図の多項式曲線にはさまざまな次数 M があり、赤い曲線で表されます。これは、緑の曲線をデータ セットに当てはめることによって生成されます。

オッカムの剃刀

上の図は、ベイズ推論がオッカムの剃刀の原理を具体化できる理由を示しています。この図は、複雑なモデルが低確率のイベントになる理由について、基本的な直感的な説明を提供します。横軸は、可能なデータセット D 空間を表します。ベイズの定理は、モデルがデータを予測する度合いに比例してモデルにフィードバックされます。これらの予測は、データ D 上の正規化された確率分布によって量子化されます。データの確率はモデル Hi を与え、P(D|Hi) は Hi モデルを支持する証拠と呼ばれます。単純なモデル H1 では、P(D|H1) で表される限定的な予測しか行えません。たとえば、より強力なモデル H2 では、モデル H1 よりも多くの自由パラメータがあり、より多様なデータ セットを予測できます。これは、いずれにしても、H2 は C1 ドメインのデータセットに対して H1 ほど強力な予測を行うことができないことも示しています。両方のモデルに等しい事前確率が割り当てられ、データセットが領域 C1 に分類されると仮定すると、効果の低いモデル H1 がより適切なモデルになります。

機能の組み合わせ

(1) これが、集合的に相関する特徴が個別に見ると重要でない理由であり、(2) 線形手法が失敗する可能性がある理由でもあります。 Isabelle Guyon の特徴抽出に関するスライドより。

無関係な機能

重要でない特徴が、KNN、クラスタリング、および類似性によってクラスタリングするその他の方法に悪影響を及ぼす理由。左と右の図は、2 種類のデータが垂直軸上で適切に分離されていることを示しています。右の図では、無関係な水平軸が追加されているため、グループ化が崩れ、多くの点が反対のクラスの隣接点になります。

基底関数

非線形基底関数は、低次元の非線形境界分類問題を高次元の線形境界問題に変換する方法です。 Andrew Moore の SVM (サポート ベクター マシン) チュートリアル スライドには、次のように書かれています。入力 x を持つ 1 次元の非線形分類問題は、2 次元の線形に分離可能な z=(x,x^2) 問題に変換されます。

識別的 vs. 生成的

識別学習が生成学習よりも簡単な理由: これら 2 つの方法の分類条件の密度は、単一の入力変数 x (左の図) と、対応する事後確率 (右の図) の例です。左の図の青い線で表されている左側のクラス条件付き密度 p(x|C1) のパターンは事後確率に影響を与えないことに注意してください。右の図の緑の縦線は、誤分類率が最小となる x の決定境界を示しています。

損失関数

学習アルゴリズムは、さまざまな損失関数を最適化するものとして考えることができます。上の図は、サポートベクターマシンに適用された「ヒンジ」エラー関数のグラフ(青い線で表示)と、ロジスティック回帰の場合のエラー関数が 1/ln(2) の係数で再スケーリングされ、ポイント (0, 1) を通過するグラフ(赤い線で表示)を示しています。黒い線は誤分類を表し、平均二乗誤差は緑の線で表されます。

最小二乗幾何学

上の図は、2 つの予測値を持つ最小二乗回帰の N 次元ジオメトリを示しています。結果のベクトル y は、入力ベクトル x1 と x2 によって張られる超平面に直交投影されます。投影 y^ は最小二乗予測のベクトルを表します。

スパース性

Lasso アルゴリズム (L1 正則化またはラプラス事前分布) がスパース解 (つまり、0 が多数含まれる重み付きベクトル) を生成する理由: 上図の Lasso アルゴリズムの推定画像 (左) とリッジ回帰アルゴリズムの推定画像 (右)。誤差等高線と制約関数が表示されます。それぞれ、赤い楕円が最小二乗誤差関数の等高線である場合、青い実線領域は制約領域 |β1| + |β2| ≤ t および β12 + β22 ≤ t2 です。

<<:  AIのダークサイドを暴く:人工知能は人間に取って代わるが、機械をどのように学習するかは分からない

>>:  GitHub で最も人気のあるオープンソース機械学習プロジェクト 28 件: TensorFlow がトップ

ブログ    
ブログ    

推薦する

Meta が AI の公平性を評価するための FACET データセットをリリース

Meta は 9 月 4 日に、研究者がコンピューター ビジョン モデルのバイアスを確認するのに役立...

...

Didiは最初の試みで惨敗した。自動運転は本当に良い市場なのか?

道路交通は常に人々の関心事であり、テクノロジーの時代において、人々は自動運転に大きな期待を寄せていま...

ジャック・マー氏、AIについて語る:今後10~15年で従来の製造業が被る苦痛は、今日の想像をはるかに超えるものになるだろう

「今後10年から15年の間に、従来の製造業が直面する苦痛は、今日私たちが想像するよりもはるかに大きく...

ユニバーサルデータ拡張技術、ランダム量子化はあらゆるデータモダリティに適用可能

自己教師あり学習アルゴリズムは、自然言語処理やコンピュータービジョンなどの分野で大きな進歩を遂げまし...

1 つの記事で機械学習を理解する: 基本概念、5 つの主要な流派、9 つの一般的なアルゴリズム

1. 機械学習の概要 1. 機械学習とは何ですか?機械は大量のデータを分析して学習します。たとえば...

...

...

人工知能はビジネスモデルの革新を促進し、行動の変化を予測することがより一般的になっている

[[353959]]現在、世界の主要国は人工知能産業の発展を非常に重視しています。我が国は、新世代の...

緩い時代は終わった:米国の自動運転規制環境は静かに厳格化している

米国の自動運転業界を取り巻く規制環境は静かに変化しつつある。過去10年間、米国は世界の自動運転分野に...

OpenAIのアルトマン氏、Nvidiaへの依存を減らすため中東の投資家とチップ協力について協議

1月20日、フィナンシャル・タイムズによると、OpenAIのCEOサム・アルトマン氏は、TSMCを含...

[ディープラーニングシリーズ] PaddlePaddle と Tensorflow を使用したクラシック CNN ネットワーク Vgg の実装

先週は、古典的な CNN ネットワーク AlexNet が画像分類に与える影響についてお話ししました...

学者は大喜び!MetaがPDFと数式を変換できるOCRツールをリリース

私たちが通常、論文や科学文献を読むときに目にするファイル形式は、基本的に PDF (Portable...

マルチモーダルディープラーニング:ディープラーニングを用いてさまざまな情報を統合する

ディープラーニングを使用して、さまざまなソースからの情報を統合します。マルチモーダルデータ私たちの世...

機械学習において、トレーニングおよび検証メトリック グラフから何がわかるでしょうか?

この記事では、トレーニングと検証の考えられる状況をまとめ、これらのチャートがどのような情報を提供でき...