ディープラーニング、NLP、コンピュータービジョンのための 30 の優れた Python ライブラリ

ディープラーニング、NLP、コンピュータービジョンのための 30 の優れた Python ライブラリ

[[357895]]

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

Gregory Piatetsky による次のグラフでは、各リポジトリにカテゴリがあり、スターと貢献者別にグラフ化されており、シンボルのサイズは Github 上のそのリポジトリへのコミット数の対数になっていることに注意してください。

図1:ディープラーニング、自然言語処理、コンピュータービジョン向けのトップPythonライブラリ

星評価と貢献者数でプロット。コミット数の対数で相対的なサイズをプロット

それでは、これ以上長々と説明せずに、KDnuggets スタッフが厳選した、ディープラーニング、自然言語処理、コンピューター ビジョン向けのトップ 30 の Python ライブラリをご紹介します。

ディープラーニング

1. テンソルフロー

スター: 149000、コミット: 97741、貢献者: 754

TensorFlow は、機械学習のためのエンドツーエンドのオープンソース プラットフォームです。包括的かつ柔軟なツール、ライブラリ、コミュニティ リソースを備えており、研究者が高度な機械学習技術の開発を進め、開発者が機械学習を活用したアプリケーションをより簡単に開発および公開するのに役立ちます。

2. ケラス

スター: 50000、コミット: 5349、貢献者: 864

Keras は、機械学習のトップ プラットフォームである TensorFlow 上で実行される、Python で記述された機械学習 API です。

3. パイトーチ

スター: 43200、コミット: 30696、貢献者: 1619

強力な GPU アクセラレーションを備えたPythonで実装されたテンソルと動的ニューラル ネットワーク。

4. ファスタイ

スター: 19800、コミット: 1450、貢献者: 607

fastai は、現在のベスト プラクティスを活用することで、トレーニング プロセスを大幅に簡素化し、ニューラル ネットワークを高速化します。

5. PyTorch ライトニング

スター: 9600、コミット: 3594、貢献者: 317

<ahelp_1" name="help_1"><divfinished-text"><divch-text"></divch-text"></divfinished-text"></ahelp_1">

高性能 AI 研究向けの PyTorch のパッケージ化された軽量バージョン。小さなサンプルを提供する代わりに、モデルを縮小することができます。

6. ジャックス

スター: 10000、コミット: 5708、貢献者: 221

Python + NumPy プログラムの組み合わせ変換: 微分化、ベクトル化、GPU/TPU 上の JIT など。

7. MXネット

スター: 19100、コミット: 11387、貢献者: 839

動的で変異を考慮したデータフロー管理スケジューラを備えた、軽量でポータブル、かつ柔軟な分散/モバイル機械学習ライブラリ。Python、R、Julia、Scala、Go、 Java Script などをサポートします。

8. 点火

スター: 3100、コミット: 747、貢献者: 112

PyTorch ニューラル ネットワークを柔軟かつ透過的にトレーニングおよび評価するための高レベル ライブラリ。

自然言語処理

9. ファストテキスト

スター: 21700、コミット: 379、貢献者: 47

fastText は、単語の表現と文の分類を効率的に学習するためのライブラリです。

10. スパーシー

スター: 17400、コミット: 11628、貢献者: 482

Pythonと Cython で実装された強力な自然言語処理 (NLP) ライブラリ

11. ゲンシム

スター: 11200、コミット: 4024、貢献者: 361

gensim は、大規模なコーパスを使用してトピック モデリング、ドキュメントのインデックス作成、類似性検索を実行します。対象読者は自然言語処理(NLP)と情報検索(IR)のコミュニティです。

12. ナラティカ

スター: 9300、コミット: 13990、貢献者: 319

NLTK(自然言語ツールキット)は、自然言語処理の研究開発のためのオープンソースのPythonモジュール、データセット、チュートリアルのセットです。

13. データセット (Huggingface)

スター: 4300、コミット: 568、貢献者: 64

PyTorch、TensorFlow、NumPy、Pandas ツールを使用して自然言語処理を行うための高速で効率的なオープン データセットと評価指標

14. トークナイザー(ハギングフェイス)

スター: 3800、コミット: 1252、貢献者: 30

研究と生産のための高速で最先端のトークナイザー

15. トランスフォーマー(ハギングフェイス)

スター: 3500、コミット: 5480、貢献者: 585

Transformers: Pytorch と TensorFlow 2.0 向けのトップクラスの自然言語処理ライブラリ

16. スタンザ

スター: 4800、コミット: 1514、貢献者: 19

多くの人間の言語のための公式標準 NLP Python ライブラリ

17. テキストブロブ

スター: 7300、コミット: 542、貢献者: 24

シンプルでPython 的なテキスト処理 - 感情分析、品詞タグ付け、名詞句抽出、翻訳など。

18. PyTorch-NLP

スター: 1800、コミット: 442、貢献者: 15

PyTorch を使用した自然言語処理 (NLP) の基本ユーティリティ

19. テキストアシー

スター: 1500、コミット: 1324、貢献者: 23

高性能な spaCy ライブラリ上に構築された、さまざまな自然言語処理 (NLP) タスクを実行するための Python ライブラリ。

20. 微調整

スター: 626、コミット: 1405、貢献者: 13

Finetune は、ユーザーがさまざまなダウンストリーム タスクに最新の事前トレーニング済み NLP モデルを活用できるようにするライブラリです。

21. テキストヒーロー

スター: 1900、コミット: 266、貢献者: 17

テキストの前処理、表現、視覚化をゼロから習得するまで。

22. スパークNLP

スター: 1700、コミット: 4363、貢献者: 50

Spark NLP は、Apache Spark ML 上に構築された自然言語処理ライブラリです。

23. グルーオンNLP

スター: 2200、コミット: 712、貢献者: 72

GluonNLP は、テキストの前処理、データセットの読み込み、ニューラル モデルの構築を簡素化し、自然言語処理 (NLP) の研究を加速するツールキットです。

コンピュータビジョン

24. 枕

スター: 7800、コミット: 10799、貢献者: 303

Pillow は PIL の非常にユーザーフレンドリーなフォークです。 PILはPythonイメージングライブラリです

25. オープンCV

スター: 49600、コミット: 29453、貢献者: 1234

オープンソースのコンピュータビジョンライブラリ

26. scikit-イメージ

スター: 4000、コミット: 12352、貢献者: 403

Python による画像処理

27. マホタス

スター: 644、コミット: 1273、貢献者: 25

Mahotas は、最速のコンピューター ビジョンアルゴリズム(実行速度を保証するためにすべてのアルゴリズムはC++で実装されています) を含み、numpy 配列で実行されるライブラリです。

28. シンプル履歴書

スター: 2400、コミット: 2625、貢献者: 69

SimpleCV は、OpenCV と Python プログラミング言語を使用したオープンソースのマシン ビジョン フレームワークです。

29. グルーオンCV

スター: 4300、コミット: 774、貢献者: 101

GluonCV は、コンピューター ビジョンにおける最先端 (SOTA) のディープラーニングモデルを提供します。

30. トーチビジョン

スター: 7500、コミット: 1286、貢献者: 334

Torchvision パッケージには、コンピューター ビジョンでよく使用されるデータセット、モデル アーキテクチャ、画像変換方法が含まれています。

<<:  2020年に人工知能を変える8つのトレンド

>>:  人工知能の10大技術分野

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

大規模データストレージソリューションの構築: MongoDB の水平拡張の検討

MongoDB は、大規模なデータ ストレージ ソリューションの構築に適した NoSQL データベー...

データサイエンティストにとって最も重要なアルゴリズムと統計モデル

数年間この業界に携わってきたデータ サイエンティストとして、私は LinkedIn や QuoLa ...

...

機械学習ソート入門 LTR - 線形モデル

[[207418]]多くの検索専門家は、「機械学習を通じて最適な重みを取得し」、それを検索クエリに使...

蘇寧電子商取引プラットフォームにおけるAI技術+短編動画の応用

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェア...

...

知識共有: 管理距離と最大ホップ数の違いに関するルーティングアルゴリズムの分析

管理距離は、ルーティング プロトコルの優先度を表す人工的に指定された数値です。数値が小さいほど、ルー...

...

...

新しい人工筋肉、応用シナリオの範囲が極めて広い!マイクロロボット:非常に必要

人工筋肉は科学界では常に重要な研究テーマとなっています。理想的には、人工筋肉は医療分野で患者の健康回...

アンサンブル法の簡単な分析

パーソナライズされた推奨システムは、金融、電子商取引、メディア、ライブ放送などの業界における Dag...

人工知能が普及せず、自動運転に支障?

今回の世界経済サイクルが底を打つにつれ、過去2年間の多くのホットスポットが「衰退」し、「閉鎖」し始め...

複雑なネットワーク分析の効率を向上!中国の科学者が強化学習の新しい枠組みを開発

最近、中国の国立国防科学技術大学、カリフォルニア大学ロサンゼルス校、ハーバード大学医学部の研究者らが...

ヘルスケア分野で人工知能がどのように台頭しているか

人工知能は世界のほぼすべての分野に変革をもたらしたようです。ヘルスケア業界は長年にわたって大きく変化...

安全で制御可能、かつ法的に準拠した人工知能は金融分野で「原則化」されている

現在、国内の新興デジタルインフラの進歩と、5G、クラウドコンピューティング、ビッグデータなどのモジュ...