オープンソース! Gartner の 100 ページの機械学習ブックが無料でダウンロードできるようになりました。

オープンソース! Gartner の 100 ページの機械学習ブックが無料でダウンロードできるようになりました。

今日の大企業は、産業化以来最大の変革を経験しています。人工知能は、産業や私たちの働き方、考え方、交流の仕方に混乱をもたらしました。ガートナーのレポートでは、2020 年までに人工知能によって 230 万の雇用が創出される一方で、180 万の雇用が減少すると予測されています。機械学習は人工知能の発展の原動力となっていますが、この分野の専門家は多くなく、大手企業が優秀な人材の獲得を競っています。

ここまで読んで、今日私が皆さんに紹介したいのは人工知能に関する本だということにお気づきかもしれません。この本はたった 152 ページで、とても短い本です。タイトル: 100ページの機械学習の本

この本では、教師あり学習と教師なし学習、サポートベクターマシン、ニューラルネットワーク、アンサンブル法、勾配降下法、クラスター分析とデータ次元削減、オートエンコーディングと転移学習、特徴エンジニアリングとハイパーパラメータ最適化について取り上げています。数学的な知識、イラストなどはすべてこの 152 ページの本に含まれています。

具体的な章のディレクトリは次のとおりです。

  • 序文
  • 第1章 はじめに
  • パート ***: 教師あり学習
  • 第2章 表記法と定義
  • 第3章 基本的なアルゴリズム
  • 第4章: 学習アルゴリズムの構造
  • 第5章 基礎練習
  • 第6章 ニューラルネットワークとディープラーニング
  • 第7章: 問題と解決策
  • 第8章 上級実践
  • パート II: 教師なし学習とその他の学習
  • 第9章: 教師なし学習
  • 第10章: その他の学習形態
  • 第11章 結論

著者は「買う前に読んでみる」という原則に従っているので、購入する価値があると思うまで、まずは無料で本をオンラインで読んだりダウンロードしたりすることができます。

この本をオンラインで読むもう一つの利点は、ページの右側にネットユーザーからのコメントがあることです。ネットユーザーからのコメントを通じて本の誤りや欠陥を見つけることができ、誤解を避けることができます。また、著者の最新の更新時間などを確認することもできます。

さらに、著者はこの本に付属するすべてのコードを GitHub でオープンソース化しています。

GitHub アドレス: https://github.com/aburkov/theMLbook

例えば、著者は本書の 9.2.4 で多変量ガウス分布 (ガウス混合モデル GMM) の内容を詳しく説明しています。

もう 1 つの例は、第 3 章の線形回帰アルゴリズムの紹介です。線形回帰アルゴリズムは、一般的な回帰学習アルゴリズムです。学習モデルは、数理統計学の回帰分析に基づいています。

対応する Python コードは次のとおりです。

  1. numpyをnpとしてインポートする
  2. matplotlib.pyplot をpltとしてインポートします。
  3.  
  4. sklearn.linear_modelからRidge をインポート
  5. sklearn.preprocessingからPolynomialFeatures をインポートします
  6. sklearn.pipelineからmake_pipeline をインポートします
  7.  
  8. matplotlibをインポートする
  9. matplotlib.rcParams[ 'mathtext.fontset' ] = 'stix'  
  10. matplotlib.rcParams[ 'font.family' ] = 'STIXGeneral'  
  11. matplotlib.rcParams.update ({ 'font.size' :18})
  12.  
  13. 定義f(x):
  14. 多項式補間によって近似する関数  
  15. 0.5 * xを返す
  16.  
  17.  
  18. #プロット使用するポイントを生成する
  19. x_plot = np.linspace(-10, 10, 100)
  20.  
  21. # ポイント生成しそのサブセットを保持する
  22. x = np.linspace(-10, 10, 100)
  23. rng = np.random.RandomState(0)
  24. rng.シャッフル(x)
  25. x = np.sort(x[:10])
  26. ノイズ = [(-2 + np.random.random()*2) i範囲(len(x))内にある場合]
  27. y = f(x) + ノイズ
  28.  
  29. #これらの配列行列バージョンを作成する
  30. X = x[:, np.newaxis]
  31. X_plot = x_plot[:, np.newaxis]
  32.  
  33. colors = [ '赤' , '赤' ]#, 'オレンジ'  
  34. 長さ = 2
  35.  
  36.  
  37. type_of_regression = [ "線形回帰" "10次回帰" ]
  38. fit = [ "フィット" "オーバーフィット" ]
  39. のために  count 、enumerate([1,10])次数:#、2、15
  40. plt.figure(カウント)
  41. 軸 = plt.gca()
  42. 軸の設定([-10,10])
  43. 軸の設定([-10,10])
  44. plt.scatter(x, y, color= 'navy' , s=30, marker= 'o' , label= "トレーニング例" )
  45. plt.xticks([-10.0, -5.0, 0.0, 5.0, 10.0])
  46. plt.yticks([-10.0, -5.0, 0.0, 5.0, 10.0])
  47. モデル = make_pipeline(PolynomialFeatures(degree), Ridge())
  48. モデル.fit(X, y)
  49. y_plot = モデル.predict(X_plot)
  50. plt.plot(x_plot, y_plot, 色=colors[ count ], 線幅=lw,
  51. ラベル=回帰の種類[カウント])
  52.  
  53. plt.legend(loc= 'ベスト' )
  54. 図1 = plt.gcf()
  55. fig1.subplots_adjust(= 0.98、下 = 0.1、= 0.98、= 0.08、水平方向のスペース = 0、水平方向のスペース = 0)
  56. fig1.savefig( '../../Illustrations/linear-regression-' + fit[ count ] + '.eps' 、 format= 'eps' 、 dpi=1000 、 bbox_inches = 'tight' 、 pad_inches = 0)
  57. fig1.savefig( '../../Illustrations/linear-regression-' + fit[ count ] + '.pdf' 、 format= 'pdf' 、 dpi=1000 、 bbox_inches = 'tight' 、 pad_inches = 0)
  58. fig1.savefig( '../../Illustrations/linear-regression-' + fit[ count ] + '.png' 、 dpi=1000、 bbox_inches = 'tight' 、 pad_inches = 0)
  59.  
  60.  
  61. plt.show()

つまり、この本のイラストにはソース コードが付属しており、GitHub で見つけることができます。

著者について

[[267420]]

Andriy Burkov 氏は、9 年前に博士号を取得した機械学習の専門家です。彼の専門は自然言語処理です。人工知能の分野では、Andriy Burkov 氏は過去 7 年間、Gartner の機械学習開発チームを率いてきました。

***、この本のダウンロードアドレスを添付します: http://themlbook.com/wiki/doku.php

<<:  マーケターがAIと機械学習を活用して顧客にリーチする方法

>>:  初心者必読!畳み込みニューラルネットワークの始め方

ブログ    
ブログ    
ブログ    

推薦する

...

戦闘計画システムにおける人工知能技術の応用に関する研究

近年、人工知能技術は飛躍的な進歩を遂げており、各国は人工知能技術の戦略的意義を認識し、国家戦略レベル...

AIがITスキルと人材の需要をどのように変えているのか

AI は急速に日常のビジネス運営に不可欠な要素になりつつあり、すでに運用プロセスの改善、顧客サービス...

...

...

53ページのPDFが広く出回り、中核社員が次々と退職。OpenAIにはどんな秘密があるのか​​?

「OpenAIが2027年にAGIを実現する」という53ページのPDFがインターネット上で広く流通...

報告書は、中国が人工知能の特許出願数で世界一であると指摘している。

最近、2020年中国人工知能産業年次大会が蘇州で開催されました。大会で発表された「中国人工知能発展報...

IDCは、年平均成長率31.4%で、世界のAIソフトウェアの収益は2027年に2,790億ドルに達すると予測している。

11月2日、市場調査会社IDCが発表した最新の予測レポートによると、世界のAIソフトウェア市場規模...

新型コロナウイルスが猛威を振るう中、AI技術は流れを変えることができるのか?

最近、謎の新型コロナウイルスが驚くべき速さで猛威を振るっています。先週木曜日、世界保健機関(WHO)...

GPT-4 モデル アーキテクチャが漏洩: 1.8 兆個のパラメータを含み、混合エキスパート モデルを使用

7月13日、海外メディアSemianalysisは最近、今年3月にOpenAIが発表したGPT-4モ...

清華大学、DeepMindなどは、既存の小サンプル学習法は安定的かつ効果的ではないと指摘し、評価フレームワークを提案した。

評価基準の違いにより、統一基準に基づく既存の小規模学習法の公平な比較が大きく妨げられており、この分野...

ワンクリックで漫画に変身!流行のDouyin特殊効果の背後にある技術

昨日、李栄浩は目が小さいことで再び注目を集めた。 「特殊効果では李容浩の目は大きくできない」というト...

中国の博士課程の学生が、2つのトランスフォーマーを使ってGANを構築しようとした。

[[382526]]最近、CV 研究者は変圧器に大きな関心を示し、多くのブレークスルーを達成しまし...

人工知能は患者と医療業界の両方にどのような利益をもたらすのでしょうか?

人工知能は医療業界のシステムと方法を変えています。半世紀以上にわたり、人工知能とヘルスケアは一緒に発...

AIと遊ぶ4つの簡単な方法

適切なプロンプトを作成する技術を習得することが、ChatGPT のような AI ベースのプロンプト ...