人工知能と機械学習のための 20 の Python オープンソースプロジェクト

この記事では、Python のトップ AI および機械学習プロジェクトを更新します。 Tensorflow は、貢献者数が 3 桁増加した最初の企業となりました。 Scikit-learn は 2 位に落ちましたが、依然として非常に大きな貢献者のコミュニティを持っています。

機械学習や人工知能の分野に参入するのは簡単ではありません。現在、利用可能なリソースが膨大にあることを考えると、多くの意欲的な専門家や愛好家にとって、この分野で正しい道を確立することは困難です。この分野は常に進化しており、私たちはその急速なペースに追いつかなければなりません。

この記事では、情報を更新して確認した後、Python を使用したトップ AI および機械学習プロジェクトを更新します。 Tensorflow は、貢献者数が 3 桁増加した最初の企業となりました。 Scikit-learn は 2 位に落ちましたが、依然として非常に大きな貢献者のコミュニティを持っています。

2016 年と比較して貢献者数が最も急速に増加したプロジェクトは次のとおりです。

1. TensorFlowの貢献者は493人から1,324人に169%増加しました

2. Deap、貢献者数が21人から39人に増加し、86%増加

3. Chainer、貢献者数が84人から154人に増加し、83%増加

4. Gensim、貢献者数が145人から262人に81%増加

5. ネオン、66%増、投稿者47人から78人へ

6. Nilearnの貢献者は46人から69人に50%増加しました

2018 年の更新:

1. Keras、629人の貢献者

2. PyTorch、貢献者399人

Github の Python AI および機械学習プロジェクトトップ 20

サイズは貢献者の数に比例し、色は貢献者の数の変化を表します。赤は貢献者数が多く、青は貢献者数が少ないことを示します。スノーフレーク形状はディープラーニングプロジェクトに適していますが、それ以外の場合は他のプロジェクトに適しています。

TensorFlow、Theano、Caffe などのディープラーニングプロジェクトは、最も人気のあるプロジェクトの 1 つです。

[[220952]]

以下のリストは、Github の貢献者の数に基づいて降順で示されています。貢献者数の変化は、2016 年にリリースされた上位 20 の Python 機械学習オープンソースプロジェクトと比較したものです。

1. TensorFlow はもともと、Google の機械知能研究組織である Google Brain チームの研究者とエンジニアによって開発されました。このシステムは、機械学習の研究を促進し、研究プロトタイプから実稼働システムへの移行を迅速かつ容易にするように設計されています。

貢献者: 1324 (168%)、Github URL: https://github.com/tensorflow/tensorflow

2. Scikit-learn は、データマイニングとデータ分析のためのシンプルで効率的なツールです。NumPy、SciPy、matplotlib に基づいており、誰でもアクセスでき、さまざまな環境で再利用できます。オープンソースで、市販されており、BSD ライセンスです。

貢献者: 1019 (39% 増加)、Github URL: https://github.com/scikit-learn/scikit-learn

3. Keras は、TensorFlow、CNTK、または Theano で実行できる、Python で記述された高レベルニューラルネットワーク API です。

貢献者: 629 (新規)、Github URL: https://github.com/keras-team/keras

4. Python のPyTorch 、テンソルおよび動的ニューラルネットワーク、強力な GPU アクセラレーション。

貢献者: 399 (新規)、Github URL: https://github.com/pytorch/pytorch

5. Theano を使用すると、多次元配列を含む数式を効率的に定義、最適化、評価できます。

貢献者: 327 (24% 増)、Github URL: https://github.com/Theano/Theano

6. Gensimは、スケーラブルな統計的セマンティクスを備えた無料の Python ライブラリで、プレーンテキストドキュメントの意味構造を分析し、意味的に類似したドキュメントを取得します。

貢献者: 262 (81% 増加)、Github URL: https://github.com/RaRe-Technologies/gensim

7. Caffe は、表現力、速度、モジュール性についてよく考えられたディープラーニングフレームワークです。これは、Berkeley Vision and Learning Center (BVLC) とコミュニティ貢献者によって開発されました。

貢献者: 260 (21% 増)、Github URL: https://github.com/RaRe-Technologies/gensim

8. Chainer は、Pythonベースのディープラーニングモデル用の独立したオープンソースフレームワークです。 Chainer は、リカレントニューラルネットワークや変分オートエンコーダなどの最新モデルを含む、包括的な範囲のディープラーニングモデルを実装するための柔軟で直感的、かつ高性能な手段を提供します。

貢献者: 154 (84% 増)、Github URL: https://github.com/chainer/chainer

9. Statsmodels は、ユーザーがデータを探索し、統計モデルを推定し、統計テストを実行できるようにする Python モジュールです。さまざまな種類のデータと各推定値に対して、記述統計、統計テスト、プロット関数、および結果統計の広範なリストが利用できます。

貢献者: 144 (33% 増)、Github URL: https://github.com/statsmodels/statsmodels/

10. Shogun は、幅広い統合された効率的な機械学習 (ML) 手法を提供する機械学習ツールボックスです。ツールボックスを使用すると、複数のデータ表現、アルゴリズムクラス、汎用ツールをシームレスに組み合わせることができます。

貢献者: 139 (32% 増)、Github URL: https://github.com/shogun-toolbox/shogun

11. Pylearn2は機械学習ライブラリです。その機能のほとんどは Theano 上に構築されています。つまり、数式を使用して Pylearn2 プラグイン (新しいモデル、アルゴリズムなど) を記述でき、Theano がこれらの式を最適化して安定化し、選択したバックエンド (CPU または GPU) にコンパイルします。

貢献者: 119 (3.5% 増)、Github URL: https://github.com/lisa-lab/pylearn2

12. NuPIC は、階層的時間記憶 (HTM) と呼ばれる大脳新皮質の理論に基づいたオープンソースプロジェクトです。 HTM 理論の一部は実装され、テストされ、アプリケーションで使用されていますが、HTM 理論のその他の部分はまだ開発中です。

貢献者: 85 (12% 増)、Github URL: https://github.com/numenta/nupic

13. Neonは Nervana の Python ベースのディープラーニングライブラリです。最高のパフォーマンスを提供しながら使いやすさも提供します。

貢献者: 78 (66% 増加)、Github URL: https://github.com/NervanaSystems/neon

14. Nilearn は、NeuroImaging データの高速かつシンプルな統計学習のための Python モジュールです。多変量統計用の scikit-learn Python ツールボックスを活用し、予測モデリング、分類、デコード、接続性分析などのアプリケーションを提供します。

貢献者: 69 (50% 増)、Github URL: https://github.com/nilearn/nilearn/branches

15. Orange3はオープンソースの機械学習とデータ視覚化の新参者ですが、専門家でもあります。大規模なツールボックスを使用したインタラクティブなデータ分析ワークフロー。

貢献者: 53 (33% 増)、Github URL: https://github.com/biolab/orange3

16. Pymcは、マルコフ連鎖モンテカルロを含むベイズ統計モデルとフィッティングアルゴリズムを実装する Python モジュールです。柔軟性と拡張性により、幅広い問題に適用できます。

貢献者: 39 (5.4% 増)、Github URL: https://github.com/pymc-devs/pymc

[[220953]]

17. Deap は、アイデアの迅速なプロトタイピングとテストのための新しい進化型計算フレームワークです。アルゴリズムを明示的にし、データ構造を透明化しようとします。マルチプロセッシングや SCOOP などの並列メカニズムと完全に連携します。

貢献者: 39 (86% 増加)、Github URL: https://github.com/deap/deap

18. Annoy (approximate Nearest Neighbor Oh Yeah) は、指定されたクエリポイントに近い空間内のポイントを検索するための Python バインディングを備えた C++ ライブラリです。また、多くのプロセスが同じデータを共有できるように、メモリにマップされる大規模な読み取り専用ファイルベースのデータ構造も作成します。

貢献者: 35 (46% 増加)、Github URL: https://github.com/spotify/annoy

19. PyBrainは Python 用のモジュール式機械学習ライブラリです。その目標は、機械学習タスクのための柔軟で使いやすく、かつ強力なアルゴリズムと、アルゴリズムをテストおよび比較するためのさまざまな定義済み環境を提供することです。

貢献者: 32 (3% 増)、Github URL: https://github.com/pybrain/pybrain

20. Fuel は、機械学習モデルに必要なデータを提供するデータパイプラインフレームワークです。 Blocks および Pylearn2 ニューラルネットワークライブラリで使用されるスキーム。

貢献者: 32 (10% 増加)、Github URL: https://github.com/mila-udem/fuel

（2018年2月に収録された寄稿者）

<<: 速報、劉強東が核爆弾を投げる！宅配便は早く消えます!

>>: AI は世界を変える。e コマースのビジネスシナリオで顔認識をどのように活用するのでしょうか?

ブログ

マイクロソフトリサーチアジアと教育省が協力し、AI産業と教育の統合に向けた双方にメリットのあるエコシステムの構築に取り組んでいます。

人工知能と機械学習のための 20 の Python オープンソースプロジェクト

2022 年のエンタープライズ向け人工知能のトップ 10 トレンド

アルゴリズム実装からMiniFlow実装まで、機械学習のためのインフラプラットフォームを構築

顔認識：最高裁は規則に従うよう求めている

マイクロソフトリサーチアジアと教育省が協力し、AI産業と教育の統合に向けた双方にメリットのあるエコシステムの構築に取り組んでいます。

コードを入力すること、詩を書くこと、論文を書くこと、すべてが可能です!史上最大のAIモデルGPT-3がGithubを席巻

IT 業界で最も過小評価されている 6 つのテクノロジーと、まだ廃れていない 1 つのテクノロジー

推薦する

米メディア：OpenAI、自社技術の軍事利用を禁じる条項を削除

Pytorch Geometric を使用したリンク予測コードの例

HipHop アルゴリズム: マイクロブログの相互作用関係を使用してソーシャルサークルをマイニングする

Nvidia は、実物大、数千ポンドを持ち上げることができるロボットなど 6 台のロボットを披露します...

ソースディレクトリ内のファイルをプレフィックスに応じて異なるディレクトリに分散するためのアルゴリズム設計と C コードの実装

人工知能が話題になって3年。雇用情勢は依然として明るいのか？

AIはもはや派手なものではなく、日常生活にもっと関連している

将来、人工知能は人類を脅かすのか？人工知能が「暴走」するのを防ぐ6つの戦略

人工知能技術は急速に発展しています。AIの信頼問題をどのように解決するのでしょうか?