機械学習にはどのような数学的基礎が必要ですか?

機械学習にはどのような数学的基礎が必要ですか?

[[184240]]

ここ数か月間、データサイエンスの世界にチャレンジして、機械学習の技術を使って統計パターンを発見し、完璧なデータ駆動型製品を構築したいという熱意を語る人が何人か私に連絡してきました。しかし、有用な結果を得るために必要な数学的な直感と知識の枠組みが実際には欠けている人もいることに気づきました。これが私がこのブログ記事を書こうと決めた主な理由です。最近では、scikit-learn、Weka、Tensorflow など、使いやすい機械学習やディープラーニングのパッケージが数多く登場しています。機械学習理論は、統計、確率、コンピューター サイエンス、アルゴリズムの学際的な分野です。データからの反復学習を通じて、インテリジェントなアプリケーションの構築に使用できる隠れた知識を発見することを目的としています。機械学習とディープラーニングの可能性は無限ですが、アルゴリズムの内部の仕組みをよりよく把握し、より良い結果を得るためには、これらの技術のほとんどを数学的に徹底的に理解することが必要です。

ロジスティック回帰とニューラルネットワークのコスト関数の計算方法

なぜ数学を重視する必要があるのでしょうか?

機械学習における数学は多くの理由で重要ですが、そのいくつかを以下に挙げます。

1. 精度、トレーニング時間、モデルの複雑さ、パラメータの数、機能の数を考慮して、適切なアルゴリズムを選択します。

2. パラメータ設定と検証戦略を選択します。

3. バイアスと分散のトレードオフを理解することで、アンダーフィッティングとオーバーフィッティングを識別します。

4. 正しい信頼区間と不確実性を推定します。

どの程度のレベルの数学が必要ですか?

機械学習 (ML) のような学際的なテーマを理解しようとする場合、主な問題は、これらの技術を理解するために必要な数学的知識の量とレベルです。この質問に対する答えは多面的であり、個人のレベルや興味によって異なります。機械学習における数式や理論の進歩が研究されており、より高度な技術に取り組んでいる研究者もいます。以下では、機械学習の科学者/エンジニアになるために必要な最低限の数学のレベルと、それぞれの数学の概念の重要性について説明します。

1. 線形代数: 私の同僚の 1 人である Skyler Speakman が最近、「線形代数は 21 世紀の数学である」と述べましたが、私もまったく同感です。機械学習の分野では、線形代数はあらゆるところに存在します。主成分分析 (PCA)、特異値分解 (SVD)、行列の固有分解、LU 分解、QR 分解、対称行列、直交化と正規直交化、行列演算、射影、固有値と固有ベクトル、ベクトル空間とノルムはすべて、機械学習で使用される最適化手法を理解するために必要です。線形代数に関するオンライン リソースがこんなにたくさんあるとは驚きです。私は、インターネット上で利用できるリソースが膨大にあるため、伝統的な教室は消滅しつつあると常々言ってきました。私のお気に入りの線形代数コースは、MIT Courseware が提供するコース (Gilbert Strang 教授による) です: http://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/

2. 確率と統計: 機械学習と統計は完全に異なる分野ではありません。実際、最近、機械学習を「機械で統計を行う」と定義した人がいました。機械学習に必要な確率と統計の理論には、組み合わせ、確率の規則と公理、ベイズの定理、ランダム変数、分散と期待値、条件付き分布と結合分布、標準分布(ベルヌーイ分布、二項分布、多項分布、一様分布、ガウス分布)、モーメント生成関数、最大尤度推定(MLE)、事前分布と事後分布、最大事後推定(MAP)、サンプリング方法などがあります。

3. 多変数微積分: 重要なトピックには、微分と積分、偏微分、ベクトル値関数、方向勾配、ヘッセ行列、ヤコビ行列、ラプラス分布、ラグランジュ分布などがあります。

4. アルゴリズムと複雑な最適化: これは、機械学習アルゴリズムの計算効率とスケーラビリティを理解し、データセットのスパース性を活用するために重要です。必要な知識には、データ構造 (バイナリ ツリー、ハッシュ、ヒープ、スタックなど)、動的プログラミング、ランダム化アルゴリズムとサブ線形アルゴリズム、グラフ理論、勾配/確率的降下法、主双対法などがあります。

5. その他: 上記の 4 つの主要領域でカバーされていない数学のトピックが含まれます。これらは、実数および複素解析 (集合とシーケンス、トポロジー、距離空間、一値連続関数、極限)、情報理論 (エントロピーと情報ゲイン)、関数空間、および多様体学習です。

機械学習に必要な数学のトピックを学習するための MOOC と教材は次のとおりです (リンクは圧縮されています)。

  • カーン アカデミーの線形代数 (http://suo.im/fgMNX)、確率と統計 (http://suo.im/CqwY9)、多変量微積分 (http://suo.im/xh6Zn)、最適化 (http://suo.im/1o2Axs)
  • 「マトリックスのコーディング: コンピューターサイエンスのアプリケーションによる線形代数」、ブラウン大学のフィリップ・クライン著: http://codingthematrix.com
  • テキサス大学の Robert van de Geijn による「線形代数 - 基礎から最先端へ」edX: http://suo.im/hKRnW
  • デイビッドソン大学の Tim Chartier による新しいコース「線形代数の応用」、パート 1: http://suo.im/48Vary、パート 2: http://suo.im/3Xm3Lh
  • ジョセフ・ブリッツスタインのハーバード大学統計学110講義: http://suo.im/2vhVmb
  • Larry Wasserman の著書「統計のすべて: 統計的推論の簡潔なコース」、ダウンロード: http://suo.im/v9u7k
  • スタンフォード大学におけるボイドとヴァンデンベルゲの凸最適化に関するコース: http://suo.im/2wdQnf
  • Udacity の統計学入門コース: http://suo.im/1enl1c
  • Andrew Ng が教える Coursera/スタンフォード大学の機械学習コース: http://suo.im/1eCvp9

このブログ投稿の主な目的は、機械学習における数学の重要性、いくつかの重要な数学のトピック、およびこれらのトピックを習得するためのいくつかの便利なリソースについて、いくつかの良いアドバイスを提供することです。しかし、機械学習愛好家の中には数学に不慣れな人もいるので、このブログを残念に思う人もいるかもしれません (本当に、そう思うつもりはありません)。初心者の場合、機械学習の研究を始めるのに多くの数学の知識は必要ありません。基本的な受講前提条件は、このブログ記事で説明されているデータ分析であり、学習を進めながら数学を学び、より多くのテクニックとアルゴリズムを習得することができます。

[この記事は、51CTOコラムニストのMachine Heart、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  LZ77 圧縮アルゴリズム エンコーディング Python 実装原理図

>>:  AI陣営を理解するためのチャート: AIを学んで間違った側に立つと自滅につながる可能性がある

ブログ    
ブログ    
ブログ    

推薦する

最新の軌道予測の概要:基本的な定義からさまざまな方法と評価まで

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

人工知能を使用して自動化されたデータセンターを構築する方法

現在、人工知能 (AI) に関する議論のほとんどは、自動運転車、チャットボット、デジタル ツイン、ロ...

95歳のハーバード大学出身者が、機械学習をゼロから始めるための必読書を執筆しました。本のリソースは現在公開されています。

機械学習を始める最も簡単な方法は何ですか?今年ハーバード大学で統計学の学位を取得したばかりのダニー・...

年末総括|2020年日本におけるAI(ロボティクス)分野の主なニュースを振り返る

在庫がなければ大晦日もありません。 2020年に日本のAI・ロボティクス分野で起こった出来事をいくつ...

金融保険業界における人工知能の3つの重要なトレンド

[51CTO.com クイック翻訳] 変化は常に起こっており、将来の変化は予測可能です。保険市場は大...

人工知能は人間の言語を習得したのか?見た目は騙されることがある

[[247418]]人工知能の分野における成果は、誤解されやすく、過大評価されやすい。このことは、人...

...

人工知能が教育を改善する32の方法

過去数年間、ソーシャルメディアから音声認識、モノのインターネットから新しい小売業、ロボットから自動運...

7つの予測ストレージ分析ツールの比較

人工知能技術は、機械学習、計算統計、さまざまなディープラーニングモデルの使用を通じて主流になりました...

...

オープンソースの人工知能アルゴリズム 新しいスーパーピクセルサンプリング、ネットワーク深層特徴推定スーパーピクセル

オープンソース AI アルゴリズム 新しいスーパーピクセル サンプリング、ネットワーク ディープ フ...

...

科学者たちは、脳波を3%という低いエラー率で直接テキストに変換する「心を読む」方法を開発した。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

固有値分解から共分散行列へ: PCA アルゴリズムの詳細な分析と実装

この記事では、まず固有ベクトルと行列との関係を簡潔かつ明確に紹介し、次にそれを基に共分散行列と主成分...