原理、コード、デモを備えたこのアルゴリズム リソースは人気を博しています。 GitHub で 2900 以上のスターを獲得

原理、コード、デモを備えたこのアルゴリズム リソースは人気を博しています。 GitHub で 2900 以上のスターを獲得

最近、GitHub で非常に包括的なアルゴリズム リソースが人気を集めています。対応する原理の紹介と実装コードだけでなく、デモも提供されています。現在、GitHub のスターの数は 2,900 を超えています。

このリソースには、線形回帰、ロジスティック回帰、K 平均アルゴリズム、ガウス分布に基づく異常検出、多層パーセプトロン (MLP) の合計 5 つのアルゴリズムがあります。

各アルゴリズムについては、数学的原理の説明、Python 実装の例、インタラクティブな Jupyter Notebook デモが提供されます。ほとんどの場合、これらのアルゴリズムの説明は、Andrew Ng の機械学習コースに基づいています。

これらのリソースに基づいて、対応するデータのトレーニング、アルゴリズムの構成を実行し、結果、グラフ、予測をブラウザですぐに表示できます。

リソースには何が含まれていますか?

アルゴリズムは 5 つあり、教師あり学習、教師なし学習、ニューラル ネットワークの 3 つのカテゴリに分類されます。各主要カテゴリには対応する紹介があり、対応する適用範囲が示されています。次に、対応するアルゴリズムのリソースがあります。

ニューラル ネットワークを例にとると、このカテゴリのアルゴリズムは多層パーセプトロンであり、合計 4 つのリソースがあります。

最初のリソースはドキュメントです。このドキュメントでは、ニューラル ネットワークと多層パーセプトロンの原理と実装ロジックを紹介し、さらに学習するための参考資料を提供しています。

2 番目のリソースは、Python で多層パーセプトロンを実装する方法を示すコードです。基本的に、各コード ブロックの前には対応するコメントがあり、コードの機能と注意事項が示されています。

最後の 2 つのリソースは、アルゴリズムとデータ セットを使用してモデルをトレーニングし、多層パーセプトロン アルゴリズムの使用をさらに理解するための Jupyter Notebook ベースのデモです。

分類器は、MNIST データセットを使用して手書きの数字 (0 ~ 9) を認識するようにトレーニングされます。もう 1 つの用途は、衣服分類器をトレーニングする Fashion-MNIST データセットです。

前提条件は何ですか?

リソースを使い始めるためのハードルは高くなく、最も基本的な要件は Python をインストールすることです。プロジェクト内のすべてのデモはブラウザで実行できるため、Jupyter をローカルにインストールする必要はありません。

Jupyter Notebook で使用されるすべてのデータセットは、データ フォルダーにあります。

この良いことをしたのは誰ですか?

このリソースの著者は、Oleksii Trekhleb というウクライナ人のエンジニアで、現在はソフトウェア技術コンサルティング会社である EPAM Systems でシニア ソフトウェア エンジニアとして働いています。

[[254713]]

同氏は、このリポジトリを設立した目的は、サードパーティのライブラリを使用して「ワンライナー」を通じて機械学習アルゴリズムを実装することではなく、これらのアルゴリズムをゼロから実践して、誰もが各アルゴリズムの背後にある原理をよりよく理解できるようにすることだと述べた。

ポータル

https://github.com/trekhleb/homemade-machine-learning

<<:  AI教育を普及させるために「幼少期から始める」という考え方は、学校、親、社会にますます受け入れられつつあります。

>>:  世界銀行:ロボットはまだ私たちの仕事を奪ってはいない

ブログ    
ブログ    
ブログ    

推薦する

MoEの大型モデルをゼロから構築するための神レベルのチュートリアルが登場

GPT-4の伝説の「必勝魔法兵器」- MoE(専門家の混合)アーキテクチャ、自分でも作成できます! ...

Appleとオレゴン州立大学がAutoFocusFormerを提案: 従来のグリッドを廃止し、適応型ダウンサンプリング画像セグメンテーションを使用

従来の RGB 画像はラスター形式で保存され、ピクセルは画像全体に均等に分散されます。ただし、この均...

インターネットの大失敗: 破壊された破壊者

[[324391]]インターネットの破壊的イノベーションは、自らの業界から生まれることはありません...

自動運転シナリオのビデオから生成された初のマルチビュー世界モデル | DrivingDiffusion: BEV データとシミュレーションの新しいアイデア

著者の個人的な考え自動運転の分野では、BEV ベースのサブタスク/エンドツーエンド ソリューションの...

クラウド コンピューティングの限界: エッジでの機械学習が必要な理由

機械学習には高い処理要件があり、通信コストがかかることから、最終的にはエッジ(スマートフォン)で動作...

過去10年間のGoogleアルゴリズムの変化

Google のアルゴリズムは毎年 500 ~ 600 回も変更されますが、その多くは小さな変更です...

世界のAI競争は中国と米国がリード。人工知能は過大評価されているのか?

[[315351]]少し前、グーグルの元CEOであるシュミット氏は下院科学宇宙技術委員会の公聴会で...

5G時代、移動ロボットは知能でどのように勝利できるのでしょうか?

移動ロボットは、環境認識、動的意思決定と計画、行動制御と実行などの複数の機能を統合した総合システムで...

...

自動化されたAIで予期せぬ収益機会を発見

急速に変化する今日の市場で競争力を維持するために、企業は次の大きな成長機会や運用上の優位性を発見する...

教師あり学習か教師なし学習か?この問題は明確にされなければならない

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

2019年に「AI+教育」分野で大手企業は何をしたのでしょうか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

プログラマーが面接でアルゴリズムについて素早く準備する方法

序文短い記事を書こうと決めたので、これがそれです。私がこの記事を書こうと思った理由は、Weibo 上...