オープンソース! Gartner の 100 ページの機械学習ブックが無料でダウンロードできるようになりました。

オープンソース! Gartner の 100 ページの機械学習ブックが無料でダウンロードできるようになりました。

今日の大企業は、産業化以来最大の変革を経験しています。人工知能は、産業や私たちの働き方、考え方、交流の仕方に混乱をもたらしました。ガートナーのレポートでは、2020 年までに人工知能によって 230 万の雇用が創出される一方で、180 万の雇用が減少すると予測されています。機械学習は人工知能の発展の原動力となっていますが、この分野の専門家は多くなく、大手企業が優秀な人材の獲得を競っています。

ここまで読んで、今日私が皆さんに紹介したいのは人工知能に関する本だということにお気づきかもしれません。この本はたった 152 ページで、とても短い本です。タイトル: 100ページの機械学習の本

この本では、教師あり学習と教師なし学習、サポートベクターマシン、ニューラルネットワーク、アンサンブル法、勾配降下法、クラスター分析とデータ次元削減、オートエンコーディングと転移学習、特徴エンジニアリングとハイパーパラメータ最適化について取り上げています。数学的な知識、イラストなどはすべてこの 152 ページの本に含まれています。

具体的な章のディレクトリは次のとおりです。

  • 序文
  • 第1章 はじめに
  • パート ***: 教師あり学習
  • 第2章 表記法と定義
  • 第3章 基本的なアルゴリズム
  • 第4章: 学習アルゴリズムの構造
  • 第5章 基礎練習
  • 第6章 ニューラルネットワークとディープラーニング
  • 第7章: 問題と解決策
  • 第8章 上級実践
  • パート II: 教師なし学習とその他の学習
  • 第9章: 教師なし学習
  • 第10章: その他の学習形態
  • 第11章 結論

著者は「買う前に読んでみる」という原則に従っているので、購入する価値があると思うまで、まずは無料で本をオンラインで読んだりダウンロードしたりすることができます。

この本をオンラインで読むもう一つの利点は、ページの右側にネットユーザーからのコメントがあることです。ネットユーザーからのコメントを通じて本の誤りや欠陥を見つけることができ、誤解を避けることができます。また、著者の最新の更新時間などを確認することもできます。

さらに、著者はこの本に付属するすべてのコードを GitHub でオープンソース化しています。

GitHub アドレス: https://github.com/aburkov/theMLbook

例えば、著者は本書の 9.2.4 で多変量ガウス分布 (ガウス混合モデル GMM) の内容を詳しく説明しています。

もう 1 つの例は、第 3 章の線形回帰アルゴリズムの紹介です。線形回帰アルゴリズムは、一般的な回帰学習アルゴリズムです。学習モデルは、数理統計学の回帰分析に基づいています。

対応する Python コードは次のとおりです。

  1. numpyをnpとしてインポートする
  2. matplotlib.pyplot をpltとしてインポートします。
  3.  
  4. sklearn.linear_modelからRidge をインポート
  5. sklearn.preprocessingからPolynomialFeatures をインポートします
  6. sklearn.pipelineからmake_pipeline をインポートします
  7.  
  8. matplotlibをインポートする
  9. matplotlib.rcParams[ 'mathtext.fontset' ] = 'stix'  
  10. matplotlib.rcParams[ 'font.family' ] = 'STIXGeneral'  
  11. matplotlib.rcParams.update ({ 'font.size' :18})
  12.  
  13. 定義f(x):
  14. 多項式補間によって近似する関数  
  15. 0.5 * xを返す
  16.  
  17.  
  18. #プロット使用するポイントを生成する
  19. x_plot = np.linspace(-10, 10, 100)
  20.  
  21. # ポイント生成しそのサブセットを保持する
  22. x = np.linspace(-10, 10, 100)
  23. rng = np.random.RandomState(0)
  24. rng.シャッフル(x)
  25. x = np.sort(x[:10])
  26. ノイズ = [(-2 + np.random.random()*2) i範囲(len(x))内にある場合]
  27. y = f(x) + ノイズ
  28.  
  29. #これらの配列行列バージョンを作成する
  30. X = x[:, np.newaxis]
  31. X_plot = x_plot[:, np.newaxis]
  32.  
  33. colors = [ '赤' , '赤' ]#, 'オレンジ'  
  34. 長さ = 2
  35.  
  36.  
  37. type_of_regression = [ "線形回帰" "10次回帰" ]
  38. fit = [ "フィット" "オーバーフィット" ]
  39. のために  count 、enumerate([1,10])次数:#、2、15
  40. plt.figure(カウント)
  41. 軸 = plt.gca()
  42. 軸の設定([-10,10])
  43. 軸の設定([-10,10])
  44. plt.scatter(x, y, color= 'navy' , s=30, marker= 'o' , label= "トレーニング例" )
  45. plt.xticks([-10.0, -5.0, 0.0, 5.0, 10.0])
  46. plt.yticks([-10.0, -5.0, 0.0, 5.0, 10.0])
  47. モデル = make_pipeline(PolynomialFeatures(degree), Ridge())
  48. モデル.fit(X, y)
  49. y_plot = モデル.predict(X_plot)
  50. plt.plot(x_plot, y_plot, 色=colors[ count ], 線幅=lw,
  51. ラベル=回帰の種類[カウント])
  52.  
  53. plt.legend(loc= 'ベスト' )
  54. 図1 = plt.gcf()
  55. fig1.subplots_adjust(= 0.98、下 = 0.1、= 0.98、= 0.08、水平方向のスペース = 0、水平方向のスペース = 0)
  56. fig1.savefig( '../../Illustrations/linear-regression-' + fit[ count ] + '.eps' 、 format= 'eps' 、 dpi=1000 、 bbox_inches = 'tight' 、 pad_inches = 0)
  57. fig1.savefig( '../../Illustrations/linear-regression-' + fit[ count ] + '.pdf' 、 format= 'pdf' 、 dpi=1000 、 bbox_inches = 'tight' 、 pad_inches = 0)
  58. fig1.savefig( '../../Illustrations/linear-regression-' + fit[ count ] + '.png' 、 dpi=1000、 bbox_inches = 'tight' 、 pad_inches = 0)
  59.  
  60.  
  61. plt.show()

つまり、この本のイラストにはソース コードが付属しており、GitHub で見つけることができます。

著者について

[[267420]]

Andriy Burkov 氏は、9 年前に博士号を取得した機械学習の専門家です。彼の専門は自然言語処理です。人工知能の分野では、Andriy Burkov 氏は過去 7 年間、Gartner の機械学習開発チームを率いてきました。

***、この本のダウンロードアドレスを添付します: http://themlbook.com/wiki/doku.php

<<:  マーケターがAIと機械学習を活用して顧客にリーチする方法

>>:  初心者必読!畳み込みニューラルネットワークの始め方

ブログ    
ブログ    

推薦する

...

人工知能によるテキスト検出の実践的有効性に関する議論

AI 支援による記事執筆は今やどこにでもあります。ChatGPT は多くの言語ベースの AI アプリ...

ウォータールー大学はヒートマップ回帰を放棄し、複数人の姿勢推定のための新しい方法を提案した。

[[436983]]キーポイント推定は、画像内の関心ポイントを特定するコンピューター ビジョン タ...

機械学習モデルの解釈可能性について

2019年2月、ポーランド政府は銀行法に改正を加え、信用判定に否定的な結果が出た場合に顧客に説明を求...

ヘルスケアにおける人工知能:現在と未来

IDCが発表した最新データによると、ソフトウェア、ハードウェア、サービスを含む世界の人工知能の収益は...

アルゴリズムが消費者を「計算」するのを防ぐにはどうすればよいでしょうか?専門家:対策のためのアルゴリズムの研究は可能

デジタル経済の時代では、目に見えず、実体のないアルゴリズムが常に消費者の選択に影響を与えます。近年、...

悪いデータは良いAIを殺すことが判明

[[421984]]データ サイエンティストは、データの準備があらゆる AI システムの成功に非常に...

マイクロソフト、物議を醸す顔認識機能を廃止へ

マイクロソフトは、動画や写真から対象者の感情を識別できると主張するツールを含む、人工知能による顔分析...

OpenAI の新しい論文が GAN を破り SOTA に到達!この圧倒的な拡散モデルは単なる仕掛けなのか、それとも本物なのか?

最近またFaceAPPが人気になってきているので、編集者もダウンロードして試してみました。大丈夫です...

Zhihu のホットトピック: 今後 3 ~ 5 年で、機械学習の人材が最も不足する分野はどれでしょうか?

[[328766]]今後 3 ~ 5 年で、機械学習のどの分野の人材が最も不足するでしょうか?今日...

史上最も完全な自動運転ポジションの紹介

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

一貫性のあるハッシュを使用して重要な負荷を分散する

大規模なネットワーク サービス (コンテンツ ホスティングなど) を実行するには、各サーバーが過負荷...

人工知能搭載の携帯電話は私たちの生活をどのように変えるのでしょうか? 携帯電話メーカーが何をしてきたか見てみましょう。

チャットができる「インテリジェント音声アシスタント」から、さまざまな家電を操作できるスマートスピーカ...