オープンソースは技術革新と急速な発展の中核です。この投稿では、Python 機械学習のオープンソース プロジェクトと、分析中に見つかった非常に興味深い洞察と傾向を紹介します。 GitHub 上の上位 20 の Python 機械学習プロジェクトを分析したところ、scikit-Learn、PyLearn2、NuPic が最も積極的に貢献されているプロジェクトであることがわかりました。 Github で人気のプロジェクトを一緒に探索してみましょう。 1 Scikit-learn: Scikit-learn は、Scipy に基づいて機械学習用に構築された Python モジュールです。サポート ベクター マシン、ロジスティック回帰、ナイーブ ベイズ分類器、ランダム フォレスト、勾配ブースティング、クラスタリング アルゴリズム、DBSCAN など、さまざまな分類、回帰、クラスタリング アルゴリズムを備えています。また、Pythonの数値科学ライブラリNumpyとScipyも設計しました。 出典: scikit-learn 2 Pylearn2: Pylearn は、機械学習の研究を簡素化する Theano ベースのライブラリです。 https://github.com/lisa-lab/pylearn2 3 NuPIC: NuPIC は、HTM 学習アルゴリズムをツールとして使用する機械知能プラットフォームです。 HTM は皮質に対して計算的に正確な方法です。 HTM の中核は、時間ベースの継続的な学習アルゴリズムと、時空間パターンの保存と呼び出しです。 NuPIC は、さまざまな問題、特にストリーミング データ ソースの異常の検出と予測に適しています。 https://github.com/numenta/nupic 4 Nilearn: Nilearn は、神経画像データの高速統計学習を可能にする Python モジュールです。 Python の scikit-learn ツールボックスと、予測モデリング、分類、デコード、接続性分析のアプリケーションを使用して多変量統計を実行します。 https://github.com/nilearn/nilearn 5 PyBrain: Pybrain は、Python 言語の強化学習、人工知能、ニューラル ネットワーク ライブラリの略称です。 その目標は、柔軟で使いやすく、かつ強力な機械学習アルゴリズムを提供し、さまざまな定義済み環境でそれらをテストしてアルゴリズムを比較することです。 pybrain.com より 6 パターン: パターンは Python のネットワーク マイニング モジュールです。データマイニング、自然言語処理、ネットワーク分析、機械学習のためのツールを提供します。ベクトル空間モデル、クラスタリング、サポートベクターマシン、パーセプトロンをサポートし、分類には KNN 分類を使用します。 https://github.com/clips/pattern 7 Fuel: Fuel は機械学習モデル用のデータを提供します。 MNIST、CIFAR-10(画像データセット)、Google の One Billion Words(テキストデータセット)などのデータセットを共有するためのインターフェースを備えています。さまざまな方法で自分のデータを置き換えるために使用します。 http://www.github.com/mila-udem/fuel 8 Bob: Bob は無料の信号処理および機械学習ツールです。ツールボックスは Python と C++ で書かれており、効率を高めて開発時間を短縮するように設計されています。画像処理ツール、オーディオおよびビデオ処理、機械学習、パターン認識のための多数のパッケージで構成されています。 翻訳元: 9 Skdata: Skdata は、機械学習と統計のためのデータセットのライブラリ プログラムです。このモジュールは、おもちゃの問題、一般的なコンピューター ビジョン、自然言語データセットに対する標準の Python プログラミング言語サポートを提供します。 出典: jaberg 10 MILK: MILK は Python の機械学習ツールキットです。 SVM、K-NN、ランダムフォレスト、決定木など、利用可能な多くの分類方法の中から主に教師あり分類を使用します。 特徴選択も実行します。 これらの分類器はさまざまな方法で組み合わせることができ、教師なし学習、アフィニティ伝播、MILK を利用した K 平均法クラスタリングなど、さまざまな分類システムを形成できます。 ミルク 11 IEPY: IEPY は、関係抽出に重点を置いたオープンソースの情報抽出ツールです。これは主に、大規模なデータセットから情報を抽出する必要があるユーザーと、新しいアルゴリズムを試してみたい科学者を対象としています。 翻訳元: 12 Quepy: Quepy は、自然言語の質問をデータベース クエリ言語に変換してデータベースをクエリするための Python フレームワークです。これは、自然言語とデータベースクエリにおけるさまざまな種類の質問として簡単に定義できます。したがって、コーディングなしで自然言語を使用してデータベースに入力する独自のシステムを構築できます。 Quepy は現在、Sparql および MQL クエリ言語をサポートしています。また、他のデータベースクエリ言語にも拡張する計画があります。 翻訳元: 13 Hebel: Hebel は、Python でニューラル ネットワークのディープラーニングを行うためのライブラリ プログラムです。GPU および CUDA アクセラレーションには PyCUDA を使用します。これは、ニューラル ネットワーク モデルの最も重要なタイプ用のツールであり、モメンタム、ネステロフ モメンタム、ドロップアウト、停止方法などのさまざまな活性化関数を提供します。 ヘベル 14 mlxtend: 日常のデータ サイエンス タスクに役立つツールと拡張機能で構成されたライブラリです。 github.com/rasbt/mlxtend より 15 nolearn: このパッケージには、機械学習タスクに役立つユーティリティ モジュールが多数含まれています。これらのモジュールの多くは scikit-learn で動作しますが、他のモジュールはより一般的に役立ちます。 翻訳元: 16 Ramp: Ramp は、Python で記述された機械学習のプロトタイピング ソリューションを高速化するためのライブラリです。これは、パンダベースの機械学習用の軽量でプラグ可能なフレームワークです。Python の既存の機械学習および統計ツール (scikit-learn、rpy2 など) にシンプルな宣言型構文探索機能を提供し、アルゴリズムと変換を迅速かつ効率的に実装します。 詳しくはこちら 17 Feature Forge: このツール セットを使用すると、scikit-learn 互換 API を通じて機械学習関数を作成およびテストできます。このライブラリは、多くの機械学習アプリケーションで役立つツールセットを提供します。 scikit-learn を使用すると、大きな助けになっていると感じるでしょう。 (ただし、これは別のアルゴリズムを使用する場合にのみ機能します。) 翻訳元: 18 REP: REP は、調和のとれた再現可能な方法でデータの移動を誘導するための原動力を提供する環境です。 TMVA、Sklearn、XGBoost、uBoost などのさまざまな操作を提供するための統合分類器ラッパーを備えています。また、集団に対して並列的に分類器をトレーニングすることもできます。インタラクティブなプロットも提供します。 翻訳元: 19 Python 機械学習サンプル: Amazon の機械学習を使用して構築されたシンプルなソフトウェアのコレクション。 サンプル 20 Python-ELM: これは、Python の scikit-learn に基づく Extreme Learning Machines の実装です。 Python ELM は、Python の ELM ライブラリに含まれています。 |
<<: 2018年ニューリテール5大トレンド:無人小売が広がり続け、人工知能やIoTが新たな価値を創出
>>: 人工知能は衣料品工場の労働者に取って代わるでしょうか?
[[406628]]仮想環境 (ALE、MuJoCo、OpenAI Gym) は、エージェントの制御...
台湾メディアiThome.com.twによると、Googleは2018年のACMマルチメディアカンフ...
ChatGPT は、大規模言語モデル (LLM) に基づく業界をリードするチャットボットとして、テク...
今、テクノロジーの世界で最もホットなものは何ですか?答えはおそらく人工知能、機械学習、ディープラーニ...
AI と IoT の融合は拡大し続けており、刺激的な将来のトレンドと機会への道を切り開いています。 ...
感染症の影響で延期されていた2020年全国人民代表大会と中国人民政治協商会議が5月21日に開幕した。...
AIスタートアップは主に2つのスタイルに分けられます。本日の記事では、その両方を分析して見ていきます...
最近、マッキンゼー・グローバル研究所は水曜日に発表した報告書の中で、技術の進歩により、将来世界で約3...
畳み込みニューラル ネットワークは、ディープ ニューラル ネットワークの中で非常に人気のあるネットワ...
ここ数年、データサイエンスの概念は多くの業界で受け入れられてきました。データ サイエンス (科学的研...
「テクノロジーがなければ、金融は存在しない。」モバイルインターネット時代の到来により、テクノロジーや...
C# のソート アルゴリズムには通常、ループと割り当てが含まれます。ソートにより、簡単な統計と分類を...
2019 IEEE 自動音声認識および理解ワークショップ (ASRU) は、2019 年 12 月 ...