機械学習とデータサイエンスに関する新しい本を本棚に追加する時期が来ました。KDnuggets 編集者の Matthew Mayo が機械学習とデータサイエンスに関連する 10 冊の本を選びました。これらの本はすべて無料で、機械学習とデータサイエンスに興味のある人にとっては必読です。 1. 統計的思考:プログラマのための確率と統計 この本は、Python プログラマー向けに特別に作成された確率と統計の入門書です。著者は、基本的な確率と統計の知識を Python プログラミングに統合し、プログラムを作成することで数学ではなく計算を使用して統計分析を実装する方法を説明します。この本では、国立衛生研究所のデータを使用したケーススタディを取り上げており、読者が現実世界のデータセットを使用してプロジェクトに取り組むことを奨励しています。 (アドレス: http://www.greenteapress.com/thinkstats/) 2. ベイズ法 ベイズ法は自然な推論方法です。ベイズ法について論じた本のほとんどは、非常に複雑な数学的分析と人工的な例に依存しているため、数学の十分な知識のない人には理解できません。読者は、人工的に処理された単純な例しか見ることができません。キャメロン氏の本は、プログラミングとコンピューティングの観点からベイズ推論を紹介し、ベイズ理論とプログラミング実践を組み合わせて、ほとんどのプログラマーが始めて習得できるようにしています (アドレス: http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/) 3. 「機械学習の詳細な理解:原理からアルゴリズムまで」 機械学習は、コンピュータサイエンスの中で最も急速に成長している分野の 1 つであり、幅広い用途があります。この教科書の目的は、機械学習とそれが提供するアルゴリズムのパラダイムについて原理的な入門を提供することです。この本では、機械学習の基礎に関する理論的知識を紹介し、それらの原理を実用的なアルゴリズムの数学的導出に変換します。本書では、基礎を紹介した後、これまでの教科書では扱われていなかったさまざまな中心的なトピックを取り上げています。 これらには、学習の計算の複雑さと凸性と安定性の概念、確率的勾配降下法、ニューラル ネットワーク、構造化出力学習などの重要なアルゴリズム パラダイム、PAC ベイズ法や圧縮ベースの境界などの新しい理論的概念に関する議論が含まれます。 (アドレス: http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/) 4. 統計の要素 この本では、共通の概念的枠組みの中でこれらの分野の重要なアイデアを紹介します。このアプローチは統計的ですが、数学よりも概念に重点が置かれています。カラフルなグラフィックを使用して多くの例が示されています。これは、統計学者や科学的または産業的なデータマイニングに関心のある人にとって貴重なリソースとなるはずです。 この本は、教師あり学習(予測)から教師なし学習まで、幅広い範囲をカバーしています。ニューラル ネットワーク、サポート ベクター マシン、分類ツリーなど、多くのトピックが含まれています。この分野のトピックをこのように包括的に扱った最初の本です。 (アドレス: http://statweb.stanford.edu/~tibs/ElemStatLearn/printings/ESLII_print10.pdf) 5. 統計学習入門 この本では統計的な学習方法を紹介しています。上級学部生、修士課程、博士課程の学生を対象としています。数学以外の科学を専攻する学生。この本には、さまざまな方法を実際の設定で実装する方法を詳しく説明する R の例も多数含まれているため、実践的なデータ サイエンティストにとって貴重なリソースとなります。 (アドレス: http://www-bcf.usc.edu/~gareth/ISL/) 6. データサイエンスの基礎 コンピュータサイエンスの伝統的な分野は依然として極めて重要ですが、将来的には、明確に定義された特定の問題に対してコンピュータをどのように役立てるかということだけでなく、アプリケーションで発生する大量のデータから有用な情報を理解して抽出するためにコンピュータを使用することに携わる研究者がますます増えていくでしょう。 これを念頭に置いて、著者らは、オートマトン理論、アルゴリズム、および関連トピックの理解が過去 40 年間に大きな影響を与えてきたのと同様に、今後 40 年間に役立つと思われる理論を網羅するためにこの本を執筆しました。 (アドレス: https://www.cs.cornell.edu/jeh/book.pdf) 7. プログラマーのためのデータマイニング実践ガイド この本はプログラマー向けに書かれたデータマイニングガイドであり、読者がデータマイニング、集合知を実践し、推奨システムを構築するのに役立ちます。この本は全部で 8 つの章から構成されており、データ マイニング、協調フィルタリング、コンテンツ フィルタリングと分類、アルゴリズム評価、ナイーブ ベイズ、非構造化テキスト分類とクラスタリングに関する基本的な知識と理論を紹介しています。この本の各章には、読者が学んだ内容を定着させるための練習問題や実践問題も用意されています。 (アドレス: http://guidetodatamining.com/) 8. ビッグデータ 本書は、スタンフォード大学の「Web マイニング」コースの内容を要約したもので、非常に大規模なデータのマイニングに焦点を当てています。この本は、コースと同様に、学部レベルのコンピュータサイエンス向けに設計されており、事前の知識は必要ありません。より深い探求をサポートするために、ほとんどの章にはさらに読むための参考文献が補足されています。 (アドレス: http://mmds.org/) 9. ディープラーニング ディープラーニングの教科書は、学生や実務者が機械学習、特にディープラーニングの分野に参入できるように設計されています。この本のオンライン版は完成しており、オンラインで無料で利用できるようになります。 (アドレス:http://www.deeplearningbook.org/) 10. 機械学習の実践 人工知能、機械学習、ディープラーニングは数多くの業界に変革をもたらしています。しかし、機械学習システムを構築するには多くの労力が必要であり、この本はそこに到達するのを支援するために書かれています。 この本の最初の部分では、主に機械学習の基礎と分類アルゴリズムの使用方法を紹介します。k近傍法アルゴリズム、ナイーブベイズアルゴリズム、ロジスティック回帰アルゴリズム、サポートベクターマシン、AdaBoostアンサンブル法、ツリーベース回帰アルゴリズム、分類および回帰ツリー(CART)アルゴリズムなど、さまざまな古典的な教師あり学習アルゴリズムを徐々に紹介します。 3 番目の部分では、教師なし学習とその主要なアルゴリズムである k-means クラスタリング アルゴリズム、Apriori アルゴリズム、FP-Growth アルゴリズムに焦点を当てます。第 4 セクションでは、機械学習アルゴリズムの補助ツールをいくつか紹介します。 (アドレス: http://www.mlyearning.org/) |
<<: 人工知能に関する究極の議論: 私たちは AI なのか?
>>: Huawei が積極的に攻勢をかけており、Google もすぐ後に続いています。人工知能をめぐるこの戦いに勝つのは誰だと思いますか?
Reddit に、私たちの現代生活におけるアルゴリズムの重要性と、どのアルゴリズムが現代文明に最も...
AlphaGoがイ・セドルに勝利したことで世界は人工知能に再び親しむようになったが、アップグレード...
最近は寒波が次々と襲来し、ダウンジャケットは冬を過ごすための必需品となっています。浙江大学は、暖かい...
タンパク質は人体のすべての細胞と組織の重要な構成要素です。体のすべての重要な成分にはタンパク質が必要...
デジタル経済の時代において、クラウド、5G、AI、ビッグデータ、人工知能などの新技術が社会の生産要素...
[[422426]]近年、ニューラル ネットワークは自然言語、画像、音声、その他のデータで大きな進歩...
[[389342]] 10年以上前であれば、おそらく多くの人が、将来中国が日本や米国と同じくらい発...
プログラマー育成ウェブサイトProgramizは10月18日、ChatGPTがプログラミング教育分野...
みなさんこんにちは。私の名前はティムです。 GPT モデルの誕生以来、そのパラメータスケールは継続的...
今年はAI分野で大規模言語モデル(LLM)が注目され、OpenAIのChatGPTやGPT-4が大人...
今日の AI テクノロジーを使用して手作業を自動化しましょう。文書の校正、アートの作成、Google...
6月20日、滴滴出行研究院副院長兼アメリカ研究院長のゴン・フェンミン博士が、TechCrunch I...
導入人工知能の重要な分野はコンピュータービジョンです。コンピューター ビジョンは、コンピューターとソ...
ディープマインドの主任研究科学者であり、ロンドン大学ユニバーシティ・カレッジのコンピューターサイエン...