機械学習の背後にある数学的なバックボーンを理解するのに役立つ5冊の本

機械学習の背後にある数学的なバックボーンを理解するのに役立つ5冊の本

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discovery)から転載したものです。

オープンソースの機械学習およびディープラーニング フレームワークの爆発的な増加により、機械学習は開発者だけが利用できるツールから、広く採用されるアプローチへと変化しました。今日、機械学習の分野はかつてないほどアクセスしやすくなりました。同時に、これは私たちが現在経験しているテクノロジーの驚異的な発展にも貢献しています。

アルゴリズムが実際にどのように機能するかを理解することで、機械学習システムの設計、開発、デバッグにおいて大きな利点が得られます。数学を考えると身震いする人は多く、機械学習には多くの数学が関係するため、この作業は多くの人にとって困難なものとなるかもしれません。

しかし、機械学習の分野では数学が障害になるべきではありません。逆に言えば、機械学習を習得するには数学をしっかり学ぶことが非常に重要です。大まかに言えば、機械学習には線形代数、確率論、多変量解析、最適化理論という 4 つの主要な数学の柱が関係しています。

これらのコア理論の強固な基盤を構築し、最先端の機械学習アルゴリズム (畳み込みネットワーク、生成的敵対的ネットワークなど) の内部の仕組みを理解するには時間がかかり、午後 1 日で完了できるものではありません。

しかし、時間を投資し続けることで、短期間で多くのことを学ぶことができます。この記事では、私にとって最も役に立った 5 冊の本を選びました。皆さんにとっても役立つことを願っています。

1. 「線形代数はこのように学ぶべきだ」 - シェルドン・アクラー

線形代数が「伝統的な」方法(最初に行列式と行列を学び、次にベクトル空間を学ぶ)で教えられると、初心者には難しすぎて、線形代数は美しいが難しい科目になってしまいます。

指導の順序を変えると、コースは非常に直感的で明確になります。この本は、非常にわかりやすく洞察力のある方法で線形代数を紹介しています。最初から古い方法ではなくこの本で線形代数を学んでいればよかった。

2. 「ディープラーニングによるコミュニケーション」 — アンドリュー・トラスク

この本はこのリストの中で私のお気に入りです。 1 冊の本しか読む時間がない場合は、必ずこの本を読んでください。

この本には、コード スニペットを主な資料として、ニューラル ネットワークの内部の仕組みを徹底的に実践的に紹介する内容が含まれています。この本は特に高度な数学に関するものではありませんが、この本を読んだ後は、データ サイエンティスト、機械学習エンジニア、その他の開発者の 95% よりもディープラーニングの数学について詳しく知ることができます。

ニューラル ネットワークをゼロから構築することもできます。これはおそらく、練習に最適な方法です。機械学習でニューラルネットワークを構築し始めたとき、NumPy を使用して畳み込みネットワークもゼロから構築しました。

3. 確率論: 熱心な初心者向け - デビッド・モーリン

機械学習に関する書籍のほとんどは、確率論を適切に紹介しておらず、わかりにくい表記法で満ちており、密度関数と離散分布を混同していることがよくあります。確率論についての背景知識がしっかりしていないと、読者が理解するのは困難です。

この本は、確率論についての詳細かつ正確で、シンプルで明確な入門書です。これは、確率論に関する事前の知識がない学習者に適しています。

4. 多変数微積分 — Denis Oulu (MIT OpenCourseWare より)

これは書籍ではなく、MIT の多変数微積分に関する大学講義の録画版で、一般に公開されています。私が知っているすべてのリソースの中で、このコースは、このテーマの入門としては群を抜いて優れています。

単変数微積分学の経験がある学生にとって、このコースは素晴らしい補足となりますが、それがなくても学生は簡単に理解することができます。唯一の欠点は、ニューラル ネットワークの基礎となる勾配降下アルゴリズムをカバーしていないことです。

5. ディープラーニング — イアン・グッドフェロー、ジョシュア・ベンジオ、アーロン・クールビル

機械学習の分野で最も才能のある人々によって書かれたこの本には、上記の理論がすべて含まれており、ディープラーニングの研究者や開発者にとって頼りになるリソースです。この本は、数学理論と重機を組み合わせて、畳み込みネットワークや再帰型ネットワーク、オートエンコーダなどの最新のディープラーニング手法への確かなガイドを提供します。

一番良い点は、この本をオンラインで無料で読むことができることです (https://www.deeplearningbook.org/)。

私が挙げた本の中で、この本はおそらく最も理解するのが難しいでしょう。ディープラーニングを理解するには、確率的な観点からアルゴリズムを見る必要がありますが、これはやや難しいです。

[[331284]]

画像ソース: unsplash

これらの本を読破するのは決して簡単ではありませんし、多くの時間もかかるかもしれませんが、私を信じてください。必ず何かが得られるはずです。知識を得ることは最高の投資です。この知識は、機械学習システムを構築するときに大きな利点をもたらします。言うまでもなく、機械学習の背後にある理論はそれ自体が美しく魅力的です。

<<:  「AI+医療」の強力な発展の勢いが医療革命を引き起こしている

>>:  AIはインフルエンサーマーケティングにどのような影響を与えているのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

Pythonがリードを拡大、PyTorchはわずか6.4%

最近、有名なデータサイエンスのウェブサイト KDnuggets が、2018 年のデータサイエンスお...

AI は「彼ら」による盗聴を防ぐことができますか?

次のような状況に遭遇したことがあるかもしれません:携帯電話でアプリを開くと、最初に表示されるのは数分...

...

第19回全国大会報告書に人工知能が盛り込まれました!私の国のAIの4つの大きな利点と唯一の欠点

[[206874]]昨日、中国共産党第19回全国代表大会が開幕した。 AIの重要なポイントを強調して...

...

...

AIはインダストリー4.0の最適化段階の鍵となる

[[282511]]製造業の新たな課題製造業はインテリジェント製造に向けてアップグレードし、変革する...

Galaxy Water Dropsが中関村フロンティアコンテストの人工知能分野でトップ10入りを果たす

10月21日、2020年全国大衆起業・イノベーション週間の北京会場である2020年中関村国際フロンテ...

農業における生成AI

農業業界は、生成型人工知能 (AI) がもたらす貴重な洞察と生産性の向上により、大きな変革の可能性を...

教師なし機械学習は産業オートメーションにどのようなメリットをもたらすのでしょうか?

現代の産業環境にはセンサーやスマート コンポーネントが満載されており、それらすべてが組み合わさって大...

最大フロー問題の解決における画期的な進歩: 新しいアルゴリズムは「驚くほど高速」

この問題はネットワークフロー理論において非常に基本的なものです。 「新しいアルゴリズムは驚くほど高速...

BEVFusionを超えて!高速かつシンプルなBEV統合展開ソリューション

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

分類アルゴリズムの概要

[[154315]]決定木分類アルゴリズム決定木誘導は古典的な分類アルゴリズムです。これは、トップダ...

GitHub で最も人気のあるオープンソース機械学習プロジェクト 28 件: TensorFlow がトップ

機械学習は現在、業界で徐々にホットな話題になりつつあります。20年以上の開発を経て、機械学習は現在、...

...