この記事では、Python のトップ AI および機械学習プロジェクトを更新します。 Tensorflow は、貢献者数が 3 桁増加した最初の企業となりました。 Scikit-learn は 2 位に落ちましたが、依然として非常に大きな貢献者のコミュニティを持っています。 機械学習や人工知能の分野に参入するのは簡単ではありません。現在、利用可能なリソースが膨大にあることを考えると、多くの意欲的な専門家や愛好家にとって、この分野で正しい道を確立することは困難です。この分野は常に進化しており、私たちはその急速なペースに追いつかなければなりません。 この記事では、情報を更新して確認した後、Python を使用したトップ AI および機械学習プロジェクトを更新します。 Tensorflow は、貢献者数が 3 桁増加した最初の企業となりました。 Scikit-learn は 2 位に落ちましたが、依然として非常に大きな貢献者のコミュニティを持っています。 2016 年と比較して貢献者数が最も急速に増加したプロジェクトは次のとおりです。 1. TensorFlowの貢献者は493人から1,324人に169%増加しました 2. Deap、貢献者数が21人から39人に増加し、86%増加 3. Chainer、貢献者数が84人から154人に増加し、83%増加 4. Gensim、貢献者数が145人から262人に81%増加 5. ネオン、66%増、投稿者47人から78人へ 6. Nilearnの貢献者は46人から69人に50%増加しました 2018 年の更新: 1. Keras、629人の貢献者 2. PyTorch、貢献者399人 Github の Python AI および機械学習プロジェクト トップ 20 サイズは貢献者の数に比例し、色は貢献者の数の変化を表します。赤は貢献者数が多く、青は貢献者数が少ないことを示します。スノーフレーク形状はディープラーニング プロジェクトに適していますが、それ以外の場合は他のプロジェクトに適しています。 TensorFlow、Theano、Caffe などのディープラーニング プロジェクトは、最も人気のあるプロジェクトの 1 つです。
以下のリストは、Github の貢献者の数に基づいて降順で示されています。貢献者数の変化は、2016 年にリリースされた上位 20 の Python 機械学習オープンソース プロジェクトと比較したものです。 1. TensorFlow はもともと、Google の機械知能研究組織である Google Brain チームの研究者とエンジニアによって開発されました。このシステムは、機械学習の研究を促進し、研究プロトタイプから実稼働システムへの移行を迅速かつ容易にするように設計されています。 貢献者: 1324 (168%)、Github URL: https://github.com/tensorflow/tensorflow 2. Scikit-learn は、データマイニングとデータ分析のためのシンプルで効率的なツールです。NumPy、SciPy、matplotlib に基づいており、誰でもアクセスでき、さまざまな環境で再利用できます。オープンソースで、市販されており、BSD ライセンスです。 貢献者: 1019 (39% 増加)、Github URL: https://github.com/scikit-learn/scikit-learn 3. Keras は、TensorFlow、CNTK、または Theano で実行できる、Python で記述された高レベル ニューラル ネットワーク API です。 貢献者: 629 (新規)、Github URL: https://github.com/keras-team/keras 4. Python のPyTorch 、テンソルおよび動的ニューラル ネットワーク、強力な GPU アクセラレーション。 貢献者: 399 (新規)、Github URL: https://github.com/pytorch/pytorch 5. Theano を使用すると、多次元配列を含む数式を効率的に定義、最適化、評価できます。 貢献者: 327 (24% 増)、Github URL: https://github.com/Theano/Theano 6. Gensimは、スケーラブルな統計的セマンティクスを備えた無料の Python ライブラリで、プレーンテキスト ドキュメントの意味構造を分析し、意味的に類似したドキュメントを取得します。 貢献者: 262 (81% 増加)、Github URL: https://github.com/RaRe-Technologies/gensim 7. Caffe は、表現力、速度、モジュール性についてよく考えられたディープラーニング フレームワークです。これは、Berkeley Vision and Learning Center (BVLC) とコミュニティ貢献者によって開発されました。 貢献者: 260 (21% 増)、Github URL: https://github.com/RaRe-Technologies/gensim 8. Chainer は、Pythonベースのディープラーニング モデル用の独立したオープン ソース フレームワークです。 Chainer は、リカレント ニューラル ネットワークや変分オートエンコーダなどの最新モデルを含む、包括的な範囲のディープラーニング モデルを実装するための柔軟で直感的、かつ高性能な手段を提供します。 貢献者: 154 (84% 増)、Github URL: https://github.com/chainer/chainer 9. Statsmodels は、ユーザーがデータを探索し、統計モデルを推定し、統計テストを実行できるようにする Python モジュールです。さまざまな種類のデータと各推定値に対して、記述統計、統計テスト、プロット関数、および結果統計の広範なリストが利用できます。 貢献者: 144 (33% 増)、Github URL: https://github.com/statsmodels/statsmodels/ 10. Shogun は、幅広い統合された効率的な機械学習 (ML) 手法を提供する機械学習ツールボックスです。ツールボックスを使用すると、複数のデータ表現、アルゴリズム クラス、汎用ツールをシームレスに組み合わせることができます。 貢献者: 139 (32% 増)、Github URL: https://github.com/shogun-toolbox/shogun 11. Pylearn2は機械学習ライブラリです。その機能のほとんどは Theano 上に構築されています。つまり、数式を使用して Pylearn2 プラグイン (新しいモデル、アルゴリズムなど) を記述でき、Theano がこれらの式を最適化して安定化し、選択したバックエンド (CPU または GPU) にコンパイルします。 貢献者: 119 (3.5% 増)、Github URL: https://github.com/lisa-lab/pylearn2 12. NuPIC は、階層的時間記憶 (HTM) と呼ばれる大脳新皮質の理論に基づいたオープンソース プロジェクトです。 HTM 理論の一部は実装され、テストされ、アプリケーションで使用されていますが、HTM 理論のその他の部分はまだ開発中です。 貢献者: 85 (12% 増)、Github URL: https://github.com/numenta/nupic 13. Neonは Nervana の Python ベースのディープラーニング ライブラリです。最高のパフォーマンスを提供しながら使いやすさも提供します。 貢献者: 78 (66% 増加)、Github URL: https://github.com/NervanaSystems/neon 14. Nilearn は、NeuroImaging データの高速かつシンプルな統計学習のための Python モジュールです。多変量統計用の scikit-learn Python ツールボックスを活用し、予測モデリング、分類、デコード、接続性分析などのアプリケーションを提供します。 貢献者: 69 (50% 増)、Github URL: https://github.com/nilearn/nilearn/branches 15. Orange3はオープンソースの機械学習とデータ視覚化の新参者ですが、専門家でもあります。大規模なツールボックスを使用したインタラクティブなデータ分析ワークフロー。 貢献者: 53 (33% 増)、Github URL: https://github.com/biolab/orange3 16. Pymcは、マルコフ連鎖モンテカルロを含むベイズ統計モデルとフィッティング アルゴリズムを実装する Python モジュールです。柔軟性と拡張性により、幅広い問題に適用できます。 貢献者: 39 (5.4% 増)、Github URL: https://github.com/pymc-devs/pymc
17. Deap は、アイデアの迅速なプロトタイピングとテストのための新しい進化型計算フレームワークです。アルゴリズムを明示的にし、データ構造を透明化しようとします。マルチプロセッシングや SCOOP などの並列メカニズムと完全に連携します。 貢献者: 39 (86% 増加)、Github URL: https://github.com/deap/deap 18. Annoy (approximate Nearest Neighbor Oh Yeah) は、指定されたクエリ ポイントに近い空間内のポイントを検索するための Python バインディングを備えた C++ ライブラリです。また、多くのプロセスが同じデータを共有できるように、メモリにマップされる大規模な読み取り専用ファイルベースのデータ構造も作成します。 貢献者: 35 (46% 増加)、Github URL: https://github.com/spotify/annoy 19. PyBrainは Python 用のモジュール式機械学習ライブラリです。その目標は、機械学習タスクのための柔軟で使いやすく、かつ強力なアルゴリズムと、アルゴリズムをテストおよび比較するためのさまざまな定義済み環境を提供することです。 貢献者: 32 (3% 増)、Github URL: https://github.com/pybrain/pybrain 20. Fuel は、機械学習モデルに必要なデータを提供するデータ パイプライン フレームワークです。 Blocks および Pylearn2 ニューラル ネットワーク ライブラリで使用されるスキーム。 貢献者: 32 (10% 増加)、Github URL: https://github.com/mila-udem/fuel (2018年2月に収録された寄稿者) |
<<: 速報、劉強東が核爆弾を投げる!宅配便は早く消えます!
>>: AI は世界を変える。e コマースのビジネス シナリオで顔認識をどのように活用するのでしょうか?
[[201067]]私はデイビッド・マーが「神経科学のチューリング」のような存在だといつも感じていま...
IT Homeは11月21日、Microsoft Azure AIインフラストラクチャがアップグレー...
[[388287]]なぜツリー構造が必要なのでしょうか? 1. 配列格納方法の分析:利点: 下付き...
10月12日、国家情報セキュリティ標準化技術委員会の公式サイトによると、同委員会が組織し策定した技...
火曜日、Stability AIは新世代の画像合成モデル「Stable Diffusion XL T...
FPS ゲームをプレイしたことがある人なら、音で位置を識別できるはずですよね?銃声と足音は敵の方向...
[[281520]] [51CTO.com クイック翻訳] 現時点では、「人工知能企業」が何であるか...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
昨日の人工知能プロジェクトに関する 10 の提案 - 理論に続き、今日は人工知能プロジェクトの 10...
データ サイエンスと機械学習の分野では、多くのモデルはデータが正規分布していると想定しているか、デー...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...