人工知能と機械学習のための 20 の Python オープンソース プロジェクト

人工知能と機械学習のための 20 の Python オープンソース プロジェクト

この記事では、Python のトップ AI および機械学習プロジェクトを更新します。 Tensorflow は、貢献者数が 3 桁増加した最初の企業となりました。 Scikit-learn は 2 位に落ちましたが、依然として非常に大きな貢献者のコミュニティを持っています。

機械学習や人工知能の分野に参入するのは簡単ではありません。現在、利用可能なリソースが膨大にあることを考えると、多くの意欲的な専門家や愛好家にとって、この分野で正しい道を確立することは困難です。この分野は常に進化しており、私たちはその急速なペースに追いつかなければなりません。

この記事では、情報を更新して確認した後、Python を使用したトップ AI および機械学習プロジェクトを更新します。 Tensorflow は、貢献者数が 3 桁増加した最初の企業となりました。 Scikit-learn は 2 位に落ちましたが、依然として非常に大きな貢献者のコミュニティを持っています。

2016 年と比較して貢献者数が最も急速に増加したプロジェクトは次のとおりです。

1. TensorFlowの貢献者は493人から1,324人に169%増加しました

2. Deap、貢献者数が21人から39人に増加し、86%増加

3. Chainer、貢献者数が84人から154人に増加し、83%増加

4. Gensim、貢献者数が145人から262人に81%増加

5. ネオン、66%増、投稿者47人から78人へ

6. Nilearnの貢献者は46人から69人に50%増加しました

2018 年の更新:

1. Keras、629人の貢献者

2. PyTorch、貢献者399人

Github の Python AI および機械学習プロジェクト トップ 20

サイズは貢献者の数に比例し、色は貢献者の数の変化を表します。赤は貢献者数が多く、青は貢献者数が少ないことを示します。スノーフレーク形状はディープラーニング プロジェクトに適していますが、それ以外の場合は他のプロジェクトに適しています。

TensorFlow、Theano、Caffe などのディープラーニング プロジェクトは、最も人気のあるプロジェクトの 1 つです。

[[220952]]

以下のリストは、Github の貢献者の数に基づいて降順で示されています。貢献者数の変化は、2016 年にリリースされた上位 20 の Python 機械学習オープンソース プロジェクトと比較したものです。

1. TensorFlow はもともと、Google の機械知能研究組織である Google Brain チームの研究者とエンジニアによって開発されました。このシステムは、機械学習の研究を促進し、研究プロトタイプから実稼働システムへの移行を迅速かつ容易にするように設計されています。

貢献者: 1324 (168%)、Github URL: https://github.com/tensorflow/tensorflow

2. Scikit-learn は、データマイニングとデータ分析のためのシンプルで効率的なツールです。NumPy、SciPy、matplotlib に基づいており、誰でもアクセスでき、さまざまな環境で再利用できます。オープンソースで、市販されており、BSD ライセンスです。

貢献者: 1019 (3​​9% 増加)、Github URL: https://github.com/scikit-learn/scikit-learn

3. Keras は、TensorFlow、CNTK、または Theano で実行できる、Python で記述された高レベル ニューラル ネットワーク API です。

貢献者: 629 (新規)、Github URL: https://github.com/keras-team/keras

4. Python のPyTorch 、テンソルおよび動的ニューラル ネットワーク、強力な GPU アクセラレーション。

貢献者: 399 (新規)、Github URL: https://github.com/pytorch/pytorch

5. Theano を使用すると、多次元配列を含む数式を効率的に定義、最適化、評価できます。

貢献者: 327 (24% 増)、Github URL: https://github.com/Theano/Theano

6. Gensimは、スケーラブルな統計的セマンティクスを備えた無料の Python ライブラリで、プレーンテキスト ドキュメントの意味構造を分析し、意味的に類似したドキュメントを取得します。

貢献者: 262 (81% 増加)、Github URL: https://github.com/RaRe-Technologies/gensim

7. Caffe は、表現力、速度、モジュール性についてよく考えられたディープラーニング フレームワークです。これは、Berkeley Vision and Learning Center (BVLC) とコミュニティ貢献者によって開発されました。

貢献者: 260 (21% 増)、Github URL: https://github.com/RaRe-Technologies/gensim

8. Chainer は、Pythonベースのディープラーニング モデル用の独立したオープン ソース フレームワークです。 Chainer は、リカレント ニューラル ネットワークや変分オートエンコーダなどの最新モデルを含む、包括的な範囲のディープラーニング モデルを実装するための柔軟で直感的、かつ高性能な手段を提供します。

貢献者: 154 (84% 増)、Github URL: https://github.com/chainer/chainer

9. Statsmodels は、ユーザーがデータを探索し、統計モデルを推定し、統計テストを実行できるようにする Python モジュールです。さまざまな種類のデータと各推定値に対して、記述統計、統計テスト、プロット関数、および結果統計の広範なリストが利用できます。

貢献者: 144 (33% 増)、Github URL: https://github.com/statsmodels/statsmodels/

10. Shogun は、幅広い統合された効率的な機械学習 (ML) 手法を提供する機械学習ツールボックスです。ツールボックスを使用すると、複数のデータ表現、アルゴリズム クラス、汎用ツールをシームレスに組み合わせることができます。

貢献者: 139 (32% 増)、Github URL: https://github.com/shogun-toolbox/shogun

11. Pylearn2は機械学習ライブラリです。その機能のほとんどは Theano 上に構築されています。つまり、数式を使用して Pylearn2 プラグイン (新しいモデル、アルゴリズムなど) を記述でき、Theano がこれらの式を最適化して安定化し、選択したバックエンド (CPU または GPU) にコンパイルします。

貢献者: 119 (3​​.5% 増)、Github URL: https://github.com/lisa-lab/pylearn2

12. NuPIC は、階層的時間記憶 (HTM) と呼ばれる大脳新皮質の理論に基づいたオープンソース プロジェクトです。 HTM 理論の一部は実装され、テストされ、アプリケーションで使用されていますが、HTM 理論のその他の部分はまだ開発中です。

貢献者: 85 (12% 増)、Github URL: https://github.com/numenta/nupic

13. Neonは Nervana の Python ベースのディープラーニング ライブラリです。最高のパフォーマンスを提供しながら使いやすさも提供します。

貢献者: 78 (66% 増加)、Github URL: https://github.com/NervanaSystems/neon

14. Nilearn は、NeuroImaging データの高速かつシンプルな統計学習のための Python モジュールです。多変量統計用の scikit-learn Python ツールボックスを活用し、予測モデリング、分類、デコード、接続性分析などのアプリケーションを提供します。

貢献者: 69 (50% 増)、Github URL: https://github.com/nilearn/nilearn/branches

15. Orange3はオープンソースの機械学習とデータ視覚化の新参者ですが、専門家でもあります。大規模なツールボックスを使用したインタラクティブなデータ分析ワークフロー。

貢献者: 53 (33% 増)、Github URL: https://github.com/biolab/orange3

16. Pymcは、マルコフ連鎖モンテカルロを含むベイズ統計モデルとフィッティング アルゴリズムを実装する Python モジュールです。柔軟性と拡張性により、幅広い問題に適用できます。

貢献者: 39 (5​​.4% 増)、Github URL: https://github.com/pymc-devs/pymc

[[220953]]

17. Deap は、アイデアの迅速なプロトタイピングとテストのための新しい進化型計算フレームワークです。アルゴリズムを明示的にし、データ構造を透明化しようとします。マルチプロセッシングや SCOOP などの並列メカニズムと完全に連携します。

貢献者: 39 (86% 増加)、Github URL: https://github.com/deap/deap

18. Annoy (approximate Nearest Neighbor Oh Yeah) は、指定されたクエリ ポイントに近い空間内のポイントを検索するための Python バインディングを備えた C++ ライブラリです。また、多くのプロセスが同じデータを共有できるように、メモリにマップされる大規模な読み取り専用ファイルベースのデータ構造も作成します。

貢献者: 35 (46% 増加)、Github URL: https://github.com/spotify/annoy

19. PyBrainは Python 用のモジュール式機械学習ライブラリです。その目標は、機械学習タスクのための柔軟で使いやすく、かつ強力なアルゴリズムと、アルゴリズムをテストおよび比較するためのさまざまな定義済み環境を提供することです。

貢献者: 32 (3% 増)、Github URL: https://github.com/pybrain/pybrain

20. Fuel は、機械学習モデルに必要なデータを提供するデータ パイプライン フレームワークです。 Blocks および Pylearn2 ニューラル ネットワーク ライブラリで使用されるスキーム。

貢献者: 32 (10% 増加)、Github URL: https://github.com/mila-udem/fuel

(2018年2月に収録された寄稿者)

<<:  速報、劉強東が核爆弾を投げる!宅配便は早く消えます!

>>:  AI は世界を変える。e コマースのビジネス シナリオで顔認識をどのように活用するのでしょうか?

ブログ    

推薦する

賢くなる方法: 神経科学にヒントを得た人工知能

[[201067]]私はデイビッド・マーが「神経科学のチューリング」のような存在だといつも感じていま...

Microsoft が 8 つの Nvidia H100 GPU を搭載した Azure ND H100 v5 仮想マシンをリリース

IT Homeは11月21日、Microsoft Azure AIインフラストラクチャがアップグレー...

...

Java プログラミング スキル - データ構造とアルゴリズム「ツリー」

[[388287]]なぜツリー構造が必要なのでしょうか? 1. 配列格納方法の分析:利点: 下付き...

Nature: 衣服をマイクとして使う?新しい素材は銃声の方向を検知し、胎児の心拍を監視できる

FPS ゲームをプレイしたことがある人なら、音で位置を識別できるはずですよね?銃声と足音は敵の方向...

...

AIスタートアップが成熟するための4つの段階と懸念事項

[[281520]] [51CTO.com クイック翻訳] 現時点では、「人工知能企業」が何であるか...

AIは、群衆の中でディープフェイクされたのはあなただけだと認識します

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

人工知能プロジェクトのための 10 のヒント - ガイド

昨日の人工知能プロジェクトに関する 10 の提案 - 理論に続き、今日は人工知能プロジェクトの 10...

データ分布の正規性を判断するための11の基本的方法

データ サイエンスと機械学習の分野では、多くのモデルはデータが正規分布していると想定しているか、デー...

5月にGitHubで最も人気のある機械学習プロジェクトはこちら

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...