Python 機械学習でプログラミングスキルを向上させる方法

この記事では、Packt の『Python Machine Learning, 3rd Edition』について説明します。これは、ML とデータサイエンスの基礎知識をすでに持っている開発者にとって優れたリソースです。

[[330048]]

数学とプログラミングのスキルを習得する

最初に言っておきますが、Python 機械学習はアマチュア向けではありません。著者は、読者が Python をしっかりと使いこなせることを前提としています。この本では、いくつかの高度なリストとコレクション機能が使用されています。また、機械学習プログラムに再利用可能なコンポーネントを使用できるようにするオブジェクト指向プログラミング手法もあります (ありがとうございます)。

この本ではこれらのライブラリの機能についてさらに詳しく説明していますが、NumPy、Pandas、Matplotlib などのデータサイエンスライブラリの基礎知識も必要です。

データサイエンス、微積分、統計の基礎をしっかりと理解していないと、Python 機械学習は少し複雑でわかりにくいと感じるでしょう。数学は入門書よりもはるかに複雑です。損失関数、正則化関数、パーセプトロン、ニューラルネットワークなどの数式が多数見つかります。

しかし、『Python Machine Learning』の著者は、例と段階的なコーディング体験を通じてこれらの式をわかりやすく説明しています。これらの例により、より幅広い読者層がコンテンツにアクセスしやすくなり、学術的な読者層向けに書かれた教科書とは一線を画す書籍となります。

また、さまざまな機械学習やディープラーニングの概念を詳細に説明した関連論文への参照も多数あり、Python 機械学習で学んだ知識をさらに広げたい場合に非常に役立ちます。

機械学習に対するオブジェクト指向の愛情

ほとんどの機械学習やデータサイエンスの本は、構造化されたコードの記述に重点を置いており、例間でのコードのコピーと貼り付けに依存しています。一方、Python 機械学習では、簡潔で再利用可能なコードを作成するためにオブジェクト指向の概念が導入されており、私はそれがとても気に入っています。

もちろん、OOP の導入により、継承、抽象化、ポリモーフィズムなどの概念に精通していない開発者にとっては、この本はより複雑なものになります。しかし、機械学習アプリケーションの構築を成功させたいのであれば、OOP スキルが必要になる可能性が高いでしょう。

Python 機械学習は、sklearn の強力な階層分解も提供します。これにより、機械学習プロジェクトで頻繁に使用する Python ライブラリの機能をより深く理解し、活用できるようになります。

DIY機械学習アプローチ

Python 機械学習の本当に魅力的な点の 1 つは、機械学習ライブラリの基本コンポーネントの一部を自分で作成できるアプローチです。独自のパーセプトロンクラスをゼロから作成できるため、ニューラルネットワークの仕組みをしっかりと理解できます。その後、パーセプトロンのコンポーネントを基にして、確率的勾配降下法 (SGD)、バックプロパゲーション、畳み込みなどの他のニューラルネットワークの概念を理解します。ニューラルネットワークの仕組みを説明する書籍やコースをいくつか見てきましたが、これはこれまで見た中で最も包括的で実践的なテキストです。

また、主成分分析 (PCA) などの基本的な機械学習アルゴリズムを再作成することもできます。これにより、アルゴリズムの各ハイパーパラメータの効果をより深く理解できるようになります。この本で構築するカスタムアルゴリズムは効率的ではなく、教育目的のみに使用されます。その後、Python Machine Learning の作者は、Scikit-learn と TensorFlow にこれらのアルゴリズムと同等のものを導入しました。

Python Machine Learning のもう 1 つの優れた機能は、機械学習アルゴリズムを実際のアプリケーションに統合するプロセスを説明する章です。バックエンドで機械学習アルゴリズムを搭載した Web アプリケーションを作成します。公平に言えば、このアプリは粗雑ですが、ポイントはこれらのさまざまな部分がどのように組み合わさるかを説明することであり、作者はそれをうまくやっています。

豊富な機械学習とディープラーニングアルゴリズム

機械学習の本を評価する際に考慮すべきことの 1 つは、探索したいアルゴリズムのリストです。この点では、Python 機械学習は期待を裏切りません。線形回帰、ロジスティック回帰、サポートベクターマシン、決定木、ランダムフォレスト、k-means クラスタリングなどの基本的な教師ありおよび教師なし機械学習アルゴリズムについて説明します。これに加えて、凝集型クラスタリングや DBSCAN など、あまり議論されていないアルゴリズムも追加されています。

その多くは、データサイエンスや機械学習の入門書ですでに読んだ内容と重複しているかもしれませんが、Python 機械学習が各トピックにもたらす奥深さは非常に歓迎すべきものです。

Python 機械学習では、mlextend を使用して異なるデータセットの機能間の相関関係を視覚化したり、回帰モデルの包括的な評価を実行したりするなど、入門書には載っていないアルゴリズムや機能についても学習します。

この本のディープラーニングのセクションでは、さまざまな種類のニューラルネットワークに関する多くの有用な理論的資料と実践的な経験が提供されます。 TensorFlow と Keras を使用して、完全接続型、再帰型、畳み込み型のニューラルネットワークを使用します。この本には、通常は注意を払いにくいトピックである TensorFlow コンポーネントの背後にあるロジックを直感的に説明するセクション全体が含まれています。

本書の他の部分と同様に、ディープラーニングのセクションも例に基づいて説明されています。この本の最後まで読めば、Transformer や Generative Adversarial Networks などの高度なアーキテクチャをいくつか理解できるでしょう。強化学習の入門章もあり、人気の OpenAI Gym ライブラリを使用します。

少し残念だったのは、自然言語処理に関する RNN セクションで、モデルのテストに関するセクションがないまま、サンプルコードが突然終了していたことです。

終わりに

以前の版と同様に、『Python Machine Learning, Third Edition』は、機械学習とデータサイエンスの基礎にすでに精通している開発者にとって優れた本です。これで、6 桁の給料をもらって仕事に就けるような機械学習やディープラーニングの専門家になれるわけではありませんが、機械学習のより高度な探求のための基礎が確実に築かれるでしょう。

次は何ですか? 興味のある分野に応じて、コンピュータービジョン、自然言語処理、または強化学習に特化した本やコースを選ぶことをお勧めします。

<<: 小売業向け AI を活用したビデオ分析

>>: 2020年のコロナウイルスがロボット経済をいかに後押ししたか