機械学習にはどのような数学的基礎が必要ですか?

機械学習にはどのような数学的基礎が必要ですか?

[[184240]]

ここ数か月間、データサイエンスの世界にチャレンジして、機械学習の技術を使って統計パターンを発見し、完璧なデータ駆動型製品を構築したいという熱意を語る人が何人か私に連絡してきました。しかし、有用な結果を得るために必要な数学的な直感と知識の枠組みが実際には欠けている人もいることに気づきました。これが私がこのブログ記事を書こうと決めた主な理由です。最近では、scikit-learn、Weka、Tensorflow など、使いやすい機械学習やディープラーニングのパッケージが数多く登場しています。機械学習理論は、統計、確率、コンピューター サイエンス、アルゴリズムの学際的な分野です。データからの反復学習を通じて、インテリジェントなアプリケーションの構築に使用できる隠れた知識を発見することを目的としています。機械学習とディープラーニングの可能性は無限ですが、アルゴリズムの内部の仕組みをよりよく把握し、より良い結果を得るためには、これらの技術のほとんどを数学的に徹底的に理解することが必要です。

ロジスティック回帰とニューラルネットワークのコスト関数の計算方法

なぜ数学を重視する必要があるのでしょうか?

機械学習における数学は多くの理由で重要ですが、そのいくつかを以下に挙げます。

1. 精度、トレーニング時間、モデルの複雑さ、パラメータの数、機能の数を考慮して、適切なアルゴリズムを選択します。

2. パラメータ設定と検証戦略を選択します。

3. バイアスと分散のトレードオフを理解することで、アンダーフィッティングとオーバーフィッティングを識別します。

4. 正しい信頼区間と不確実性を推定します。

どの程度のレベルの数学が必要ですか?

機械学習 (ML) のような学際的なテーマを理解しようとする場合、主な問題は、これらの技術を理解するために必要な数学的知識の量とレベルです。この質問に対する答えは多面的であり、個人のレベルや興味によって異なります。機械学習における数式や理論の進歩が研究されており、より高度な技術に取り組んでいる研究者もいます。以下では、機械学習の科学者/エンジニアになるために必要な最低限の数学のレベルと、それぞれの数学の概念の重要性について説明します。

1. 線形代数: 私の同僚の 1 人である Skyler Speakman が最近、「線形代数は 21 世紀の数学である」と述べましたが、私もまったく同感です。機械学習の分野では、線形代数はあらゆるところに存在します。主成分分析 (PCA)、特異値分解 (SVD)、行列の固有分解、LU 分解、QR 分解、対称行列、直交化と正規直交化、行列演算、射影、固有値と固有ベクトル、ベクトル空間とノルムはすべて、機械学習で使用される最適化手法を理解するために必要です。線形代数に関するオンライン リソースがこんなにたくさんあるとは驚きです。私は、インターネット上で利用できるリソースが膨大にあるため、伝統的な教室は消滅しつつあると常々言ってきました。私のお気に入りの線形代数コースは、MIT Courseware が提供するコース (Gilbert Strang 教授による) です: http://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/

2. 確率と統計: 機械学習と統計は完全に異なる分野ではありません。実際、最近、機械学習を「機械で統計を行う」と定義した人がいました。機械学習に必要な確率と統計の理論には、組み合わせ、確率の規則と公理、ベイズの定理、ランダム変数、分散と期待値、条件付き分布と結合分布、標準分布(ベルヌーイ分布、二項分布、多項分布、一様分布、ガウス分布)、モーメント生成関数、最大尤度推定(MLE)、事前分布と事後分布、最大事後推定(MAP)、サンプリング方法などがあります。

3. 多変数微積分: 重要なトピックには、微分と積分、偏微分、ベクトル値関数、方向勾配、ヘッセ行列、ヤコビ行列、ラプラス分布、ラグランジュ分布などがあります。

4. アルゴリズムと複雑な最適化: これは、機械学習アルゴリズムの計算効率とスケーラビリティを理解し、データセットのスパース性を活用するために重要です。必要な知識には、データ構造 (バイナリ ツリー、ハッシュ、ヒープ、スタックなど)、動的プログラミング、ランダム化アルゴリズムとサブ線形アルゴリズム、グラフ理論、勾配/確率的降下法、主双対法などがあります。

5. その他: 上記の 4 つの主要領域でカバーされていない数学のトピックが含まれます。これらは、実数および複素解析 (集合とシーケンス、トポロジー、距離空間、一値連続関数、極限)、情報理論 (エントロピーと情報ゲイン)、関数空間、および多様体学習です。

機械学習に必要な数学のトピックを学習するための MOOC と教材は次のとおりです (リンクは圧縮されています)。

  • カーン アカデミーの線形代数 (http://suo.im/fgMNX)、確率と統計 (http://suo.im/CqwY9)、多変量微積分 (http://suo.im/xh6Zn)、最適化 (http://suo.im/1o2Axs)
  • 「マトリックスのコーディング: コンピューターサイエンスのアプリケーションによる線形代数」、ブラウン大学のフィリップ・クライン著: http://codingthematrix.com
  • テキサス大学の Robert van de Geijn による「線形代数 - 基礎から最先端へ」edX: http://suo.im/hKRnW
  • デイビッドソン大学の Tim Chartier による新しいコース「線形代数の応用」、パート 1: http://suo.im/48Vary、パート 2: http://suo.im/3Xm3Lh
  • ジョセフ・ブリッツスタインのハーバード大学統計学110講義: http://suo.im/2vhVmb
  • Larry Wasserman の著書「統計のすべて: 統計的推論の簡潔なコース」、ダウンロード: http://suo.im/v9u7k
  • スタンフォード大学におけるボイドとヴァンデンベルゲの凸最適化に関するコース: http://suo.im/2wdQnf
  • Udacity の統計学入門コース: http://suo.im/1enl1c
  • Andrew Ng が教える Coursera/スタンフォード大学の機械学習コース: http://suo.im/1eCvp9

このブログ投稿の主な目的は、機械学習における数学の重要性、いくつかの重要な数学のトピック、およびこれらのトピックを習得するためのいくつかの便利なリソースについて、いくつかの良いアドバイスを提供することです。しかし、機械学習愛好家の中には数学に不慣れな人もいるので、このブログを残念に思う人もいるかもしれません (本当に、そう思うつもりはありません)。初心者の場合、機械学習の研究を始めるのに多くの数学の知識は必要ありません。基本的な受講前提条件は、このブログ記事で説明されているデータ分析であり、学習を進めながら数学を学び、より多くのテクニックとアルゴリズムを習得することができます。

[この記事は、51CTOコラムニストのMachine Heart、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  LZ77 圧縮アルゴリズム エンコーディング Python 実装原理図

>>:  AI陣営を理解するためのチャート: AIを学んで間違った側に立つと自滅につながる可能性がある

ブログ    
ブログ    

推薦する

...

...

AIは賢くなり、これらの新しい技術は流行の防止と生産の再開に役立つだろう

新型コロナウイルス肺炎の流行状況の変化に伴い、企業や機関の業務と生産の再開が現在の仕事の新たな焦点と...

初心者必読!畳み込みニューラルネットワークの始め方

畳み込みニューラル ネットワークは、ディープ ニューラル ネットワークの中で非常に人気のあるネットワ...

2021年の人工知能業界の予測

[[375635]] 2020 年は激動の年であり、組織は数多くの課題に直面しました。 2021年に...

ゲーム依存症対策は年々厳しくなり、顔認証対策は厳しすぎるとの報道も

[[415155]]未成年者のゲームプレイの問題に関しては、依存症防止システムが厳しすぎると不満を言...

インテリジェントビル通信システムの構成と要件

ハイテクの継続的な発展に伴い、インテリジェントビル通信システムの構成は絶えず変化し、要件は絶えず増加...

グーグルは複数の病院と協力し、AI医療の可能性を探る実験を行っているという

7月11日、ウォール・ストリート・ジャーナルによると、Googleは最近、いくつかの病院と協力し、M...

清華大学は顔認識技術に脆弱性を発見、セキュリティ問題を真剣に受け止める必要がある

このテストでは合計20台の携帯電話が選ばれ、そのうち1台は海外製、残りの19台は国内トップ5の携帯電...

顔認識は簡単に破られるのでしょうか?虐待と闘う方法

未来産業研究所は、顔認識市場規模は今後5年間で平均23%の複合成長率を維持し、2024年までに市場規...

StarCraft II の共同競技ベンチマークが SOTA を上回り、新しい Transformer アーキテクチャがマルチエージェント強化学習の問題を解決

マルチエージェント強化学習 (MARL) は、各エージェントのポリシー改善の方向性を特定するだけでな...

エッジ AI で建物のシステム障害を回避

ビルの管理者や運営者は、暖房や冷房、照明システム、エレベーターの故障など、ビルのシステムや設備の予期...

宇宙も「独学」です!このプロセスは機械学習アルゴリズムに似ており、物理法則を刷新するものである。

宇宙は自ら学ぶことができるのでしょうか?科学者たちは、自ら学ぶ能力を持つ宇宙、「自己学習宇宙」という...

2023年世界AI指数ランキング発表:米国と中国が1位と2位、アジア諸国は好成績

英国のメディア組織Tortoise Mediaは最近、2023年の世界AI指数ランキングを発表しまし...