機械学習とデータサイエンスに関する新しい本を本棚に追加する時期が来ました。KDnuggets 編集者の Matthew Mayo が機械学習とデータサイエンスに関連する 10 冊の本を選びました。これらの本はすべて無料で、機械学習とデータサイエンスに興味のある人にとっては必読です。 1. 統計的思考:プログラマのための確率と統計 この本は、Python プログラマー向けに特別に作成された確率と統計の入門書です。著者は、基本的な確率と統計の知識を Python プログラミングに統合し、プログラムを作成することで数学ではなく計算を使用して統計分析を実装する方法を説明します。この本では、国立衛生研究所のデータを使用したケーススタディを取り上げており、読者が現実世界のデータセットを使用してプロジェクトに取り組むことを奨励しています。 (アドレス: http://www.greenteapress.com/thinkstats/) 2. ベイズ法 ベイズ法は自然な推論方法です。ベイズ法について論じた本のほとんどは、非常に複雑な数学的分析と人工的な例に依存しているため、数学の十分な知識のない人には理解できません。読者は、人工的に処理された単純な例しか見ることができません。キャメロン氏の本は、プログラミングとコンピューティングの観点からベイズ推論を紹介し、ベイズ理論とプログラミング実践を組み合わせて、ほとんどのプログラマーが始めて習得できるようにしています (アドレス: http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/) 3. 「機械学習の詳細な理解:原理からアルゴリズムまで」 機械学習は、コンピュータサイエンスの中で最も急速に成長している分野の 1 つであり、幅広い用途があります。この教科書の目的は、機械学習とそれが提供するアルゴリズムのパラダイムについて原理的な入門を提供することです。この本では、機械学習の基礎に関する理論的知識を紹介し、それらの原理を実用的なアルゴリズムの数学的導出に変換します。本書では、基礎を紹介した後、これまでの教科書では扱われていなかったさまざまな中心的なトピックを取り上げています。 これらには、学習の計算の複雑さと凸性と安定性の概念、確率的勾配降下法、ニューラル ネットワーク、構造化出力学習などの重要なアルゴリズム パラダイム、PAC ベイズ法や圧縮ベースの境界などの新しい理論的概念に関する議論が含まれます。 (アドレス: http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/) 4. 統計の要素 この本では、共通の概念的枠組みの中でこれらの分野の重要なアイデアを紹介します。このアプローチは統計的ですが、数学よりも概念に重点が置かれています。カラフルなグラフィックを使用して多くの例が示されています。これは、統計学者や科学的または産業的なデータマイニングに関心のある人にとって貴重なリソースとなるはずです。 この本は、教師あり学習(予測)から教師なし学習まで、幅広い範囲をカバーしています。ニューラル ネットワーク、サポート ベクター マシン、分類ツリーなど、多くのトピックが含まれています。この分野のトピックをこのように包括的に扱った最初の本です。 (アドレス: http://statweb.stanford.edu/~tibs/ElemStatLearn/printings/ESLII_print10.pdf) 5. 統計学習入門 この本では統計的な学習方法を紹介しています。上級学部生、修士課程、博士課程の学生を対象としています。数学以外の科学を専攻する学生。この本には、さまざまな方法を実際の設定で実装する方法を詳しく説明する R の例も多数含まれているため、実践的なデータ サイエンティストにとって貴重なリソースとなります。 (アドレス: http://www-bcf.usc.edu/~gareth/ISL/) 6. データサイエンスの基礎 コンピュータサイエンスの伝統的な分野は依然として極めて重要ですが、将来的には、明確に定義された特定の問題に対してコンピュータをどのように役立てるかということだけでなく、アプリケーションで発生する大量のデータから有用な情報を理解して抽出するためにコンピュータを使用することに携わる研究者がますます増えていくでしょう。 これを念頭に置いて、著者らは、オートマトン理論、アルゴリズム、および関連トピックの理解が過去 40 年間に大きな影響を与えてきたのと同様に、今後 40 年間に役立つと思われる理論を網羅するためにこの本を執筆しました。 (アドレス: https://www.cs.cornell.edu/jeh/book.pdf) 7. プログラマーのためのデータマイニング実践ガイド この本はプログラマー向けに書かれたデータマイニングガイドであり、読者がデータマイニング、集合知を実践し、推奨システムを構築するのに役立ちます。この本は全部で 8 つの章から構成されており、データ マイニング、協調フィルタリング、コンテンツ フィルタリングと分類、アルゴリズム評価、ナイーブ ベイズ、非構造化テキスト分類とクラスタリングに関する基本的な知識と理論を紹介しています。この本の各章には、読者が学んだ内容を定着させるための練習問題や実践問題も用意されています。 (アドレス: http://guidetodatamining.com/) 8. ビッグデータ 本書は、スタンフォード大学の「Web マイニング」コースの内容を要約したもので、非常に大規模なデータのマイニングに焦点を当てています。この本は、コースと同様に、学部レベルのコンピュータサイエンス向けに設計されており、事前の知識は必要ありません。より深い探求をサポートするために、ほとんどの章にはさらに読むための参考文献が補足されています。 (アドレス: http://mmds.org/) 9. ディープラーニング ディープラーニングの教科書は、学生や実務者が機械学習、特にディープラーニングの分野に参入できるように設計されています。この本のオンライン版は完成しており、オンラインで無料で利用できるようになります。 (アドレス:http://www.deeplearningbook.org/) 10. 機械学習の実践 人工知能、機械学習、ディープラーニングは数多くの業界に変革をもたらしています。しかし、機械学習システムを構築するには多くの労力が必要であり、この本はそこに到達するのを支援するために書かれています。 この本の最初の部分では、主に機械学習の基礎と分類アルゴリズムの使用方法を紹介します。k近傍法アルゴリズム、ナイーブベイズアルゴリズム、ロジスティック回帰アルゴリズム、サポートベクターマシン、AdaBoostアンサンブル法、ツリーベース回帰アルゴリズム、分類および回帰ツリー(CART)アルゴリズムなど、さまざまな古典的な教師あり学習アルゴリズムを徐々に紹介します。 3 番目の部分では、教師なし学習とその主要なアルゴリズムである k-means クラスタリング アルゴリズム、Apriori アルゴリズム、FP-Growth アルゴリズムに焦点を当てます。第 4 セクションでは、機械学習アルゴリズムの補助ツールをいくつか紹介します。 (アドレス: http://www.mlyearning.org/) |
<<: 人工知能に関する究極の議論: 私たちは AI なのか?
>>: Huawei が積極的に攻勢をかけており、Google もすぐ後に続いています。人工知能をめぐるこの戦いに勝つのは誰だと思いますか?
国民経済と国民生活に関わる基幹産業として、製造業における新技術や新政策は主要メディアの注目の的となっ...
10月24日、チップ大手のNvidiaが人工知能(AI)コンピューティングチップ市場を独占した。現在...
最初のトレンドは、すべてのIT大手がAIクラウドサービスに多額の投資を行うことです。AI-aaS、つ...
オープンAIのCEOサム・アルトマン氏は、昨年の同社の経営混乱時の同氏の行動が「強制解雇には当たらな...
[[426024]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...
2000年前に生きていた古代人が1000年前に戻ったとしても、適応できるものは多くないかもしれません...
将来、テーブルクロスがあなたの持ち物の所在を知らせたり、あなたの食事を追跡したりすることを想像してみ...
大学入試はすでに始まっています。分厚いノートを開いて専攻を選ぶ日はまだまだ遠いのでしょうか。この季節...
音声認識技術は 1950 年代に開発され始めました。それでは、このテクノロジーが長年にわたってどのよ...
OpenAIとマスク氏は激しく議論していたが、誤ってClaude 3の新しいスキルを公開してしまった...
人工知能が20年間進歩したにもかかわらず、オフィスワークのほとんどは単純な頭脳労働で構成されているよ...
[[422559]]ビッグデータ概要著者: ミッキー6月27日に英国のデイリーメール紙が公開した動画...