オープンソース! Gartner の 100 ページの機械学習ブックが無料でダウンロードできるようになりました。

オープンソース! Gartner の 100 ページの機械学習ブックが無料でダウンロードできるようになりました。

今日の大企業は、産業化以来最大の変革を経験しています。人工知能は、産業や私たちの働き方、考え方、交流の仕方に混乱をもたらしました。ガートナーのレポートでは、2020 年までに人工知能によって 230 万の雇用が創出される一方で、180 万の雇用が減少すると予測されています。機械学習は人工知能の発展の原動力となっていますが、この分野の専門家は多くなく、大手企業が優秀な人材の獲得を競っています。

ここまで読んで、今日私が皆さんに紹介したいのは人工知能に関する本だということにお気づきかもしれません。この本はたった 152 ページで、とても短い本です。タイトル: 100ページの機械学習の本

この本では、教師あり学習と教師なし学習、サポートベクターマシン、ニューラルネットワーク、アンサンブル法、勾配降下法、クラスター分析とデータ次元削減、オートエンコーディングと転移学習、特徴エンジニアリングとハイパーパラメータ最適化について取り上げています。数学的な知識、イラストなどはすべてこの 152 ページの本に含まれています。

具体的な章のディレクトリは次のとおりです。

  • 序文
  • 第1章 はじめに
  • パート ***: 教師あり学習
  • 第2章 表記法と定義
  • 第3章 基本的なアルゴリズム
  • 第4章: 学習アルゴリズムの構造
  • 第5章 基礎練習
  • 第6章 ニューラルネットワークとディープラーニング
  • 第7章: 問題と解決策
  • 第8章 上級実践
  • パート II: 教師なし学習とその他の学習
  • 第9章: 教師なし学習
  • 第10章: その他の学習形態
  • 第11章 結論

著者は「買う前に読んでみる」という原則に従っているので、購入する価値があると思うまで、まずは無料で本をオンラインで読んだりダウンロードしたりすることができます。

この本をオンラインで読むもう一つの利点は、ページの右側にネットユーザーからのコメントがあることです。ネットユーザーからのコメントを通じて本の誤りや欠陥を見つけることができ、誤解を避けることができます。また、著者の最新の更新時間などを確認することもできます。

さらに、著者はこの本に付属するすべてのコードを GitHub でオープンソース化しています。

GitHub アドレス: https://github.com/aburkov/theMLbook

例えば、著者は本書の 9.2.4 で多変量ガウス分布 (ガウス混合モデル GMM) の内容を詳しく説明しています。

もう 1 つの例は、第 3 章の線形回帰アルゴリズムの紹介です。線形回帰アルゴリズムは、一般的な回帰学習アルゴリズムです。学習モデルは、数理統計学の回帰分析に基づいています。

対応する Python コードは次のとおりです。

  1. numpyをnpとしてインポートする
  2. matplotlib.pyplot をpltとしてインポートします。
  3.  
  4. sklearn.linear_modelからRidge をインポート
  5. sklearn.preprocessingからPolynomialFeatures をインポートします
  6. sklearn.pipelineからmake_pipeline をインポートします
  7.  
  8. matplotlibをインポートする
  9. matplotlib.rcParams[ 'mathtext.fontset' ] = 'stix'  
  10. matplotlib.rcParams[ 'font.family' ] = 'STIXGeneral'  
  11. matplotlib.rcParams.update ({ 'font.size' :18})
  12.  
  13. 定義f(x):
  14. 多項式補間によって近似する関数  
  15. 0.5 * xを返す
  16.  
  17.  
  18. #プロット使用するポイントを生成する
  19. x_plot = np.linspace(-10, 10, 100)
  20.  
  21. # ポイント生成しそのサブセットを保持する
  22. x = np.linspace(-10, 10, 100)
  23. rng = np.random.RandomState(0)
  24. rng.シャッフル(x)
  25. x = np.sort(x[:10])
  26. ノイズ = [(-2 + np.random.random()*2) i範囲(len(x))内にある場合]
  27. y = f(x) + ノイズ
  28.  
  29. #これらの配列行列バージョンを作成する
  30. X = x[:, np.newaxis]
  31. X_plot = x_plot[:, np.newaxis]
  32.  
  33. colors = [ '赤' , '赤' ]#, 'オレンジ'  
  34. 長さ = 2
  35.  
  36.  
  37. type_of_regression = [ "線形回帰" "10次回帰" ]
  38. fit = [ "フィット" "オーバーフィット" ]
  39. のために  count 、enumerate([1,10])次数:#、2、15
  40. plt.figure(カウント)
  41. 軸 = plt.gca()
  42. 軸の設定([-10,10])
  43. 軸の設定([-10,10])
  44. plt.scatter(x, y, color= 'navy' , s=30, marker= 'o' , label= "トレーニング例" )
  45. plt.xticks([-10.0, -5.0, 0.0, 5.0, 10.0])
  46. plt.yticks([-10.0, -5.0, 0.0, 5.0, 10.0])
  47. モデル = make_pipeline(PolynomialFeatures(degree), Ridge())
  48. モデル.fit(X, y)
  49. y_plot = モデル.predict(X_plot)
  50. plt.plot(x_plot, y_plot, 色=colors[ count ], 線幅=lw,
  51. ラベル=回帰の種類[カウント])
  52.  
  53. plt.legend(loc= 'ベスト' )
  54. 図1 = plt.gcf()
  55. fig1.subplots_adjust(= 0.98、下 = 0.1、= 0.98、= 0.08、水平方向のスペース = 0、水平方向のスペース = 0)
  56. fig1.savefig( '../../Illustrations/linear-regression-' + fit[ count ] + '.eps' 、 format= 'eps' 、 dpi=1000 、 bbox_inches = 'tight' 、 pad_inches = 0)
  57. fig1.savefig( '../../Illustrations/linear-regression-' + fit[ count ] + '.pdf' 、 format= 'pdf' 、 dpi=1000 、 bbox_inches = 'tight' 、 pad_inches = 0)
  58. fig1.savefig( '../../Illustrations/linear-regression-' + fit[ count ] + '.png' 、 dpi=1000、 bbox_inches = 'tight' 、 pad_inches = 0)
  59.  
  60.  
  61. plt.show()

つまり、この本のイラストにはソース コードが付属しており、GitHub で見つけることができます。

著者について

[[267420]]

Andriy Burkov 氏は、9 年前に博士号を取得した機械学習の専門家です。彼の専門は自然言語処理です。人工知能の分野では、Andriy Burkov 氏は過去 7 年間、Gartner の機械学習開発チームを率いてきました。

***、この本のダウンロードアドレスを添付します: http://themlbook.com/wiki/doku.php

<<:  マーケターがAIと機械学習を活用して顧客にリーチする方法

>>:  初心者必読!畳み込みニューラルネットワークの始め方

ブログ    

推薦する

...

...

...

戦場のアルファ碁:人工知能がもたらす軍事革命が静かに始まった

人工知能と機械学習が人間の世界を完全に変える運命にあることは疑いようがありません。これは軍事分野にも...

iSoftStoneはインテリジェントな顧客サービス市場に参入し、専門性と専門知識で地位を確立しました。

今日、カスタマー サービス ロボットは私たちにとって馴染み深い存在です。電話料金、住所、登録、ビジネ...

ChatGPT: 機械学習とディープラーニングを簡単かつ楽しく

ディープラーニングと機械学習は、今日のテクノロジーのホットな話題ですが、初心者にとっては少し複雑で難...

アルゴリズムの微積分: 面接で目立つための関数微分公式 5 つ

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

伝染病警報!人工知能は何をするのでしょうか?

中国で新型コロナウイルスの感染が初めて確認されたのは2019年12月19日。感染源については、これま...

機械学習エンジニアに必要な 5 つのソフトスキル

[[395964]]導入機械学習エンジニアの役割は通常、プログラミング、ソフトウェア実装、データ分析...

...

...

NvidiaとGenentechがAIを活用して新薬発見を加速させる提携

Nvidia はバイオテクノロジー大手の Genentech と提携し、生成 AI を含む最先端の人...

...

...