今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

先週、Github で最も人気のあるプロジェクトは、最近バージョン 2.0 に更新された自然言語処理 Python ライブラリ spaCy でした。 SpaCy は、自然言語処理の研究に基づいて作成されたオープンソース プロジェクトであり、最終的には実際の製品やソリューションに使用することを目的としています。バージョン 2.0 では、新しいニューラル ネットワーク モデル、より多くの言語のサポート、ドキュメントの改善など、いくつかの新機能が追加されています。

SpaCy の作者である Matthew Honnibal 氏は、リリース ノートで、新しいバージョンでは最先端のディープラーニング技術を使用して spaCy が更新され、スケーラブルなクラウド コンピューティング ワークフローで spaCy を実行しやすくなると書いています。

新しいバージョンには、7 つ以上の言語に対応した 13 のニューラル ネットワーク モデルが含まれています。また、8 つの新しい言語 (英語、ドイツ語、スペイン語、ポルトガル語、フランス語、イタリア語、オランダ語、多言語 NER) のアルファ トークン化サポートも追加されました。小さなテーブルで大きな語彙をサポートするために、ブルーム埋め込み戦略を使用します。コア ニューラル ネットワーク モデルには品詞タグ、依存タグ、名前付きエンティティが含まれ、小規模モデルにはコンテキスト固有のトークン ベクトルのみが含まれ、中規模モデルには単語ベクトルが含まれます。

このバージョンでは、使用ガイド、API ドキュメント、コード例のほとんどが書き直されました。ドキュメントには、カスタム処理パイプライン、視覚化ツール、トレーニング チュートリアル、単語ベクトル、ルールベースのマッチングに関する情報が含まれています。重要な概念の説明と図解、およびライブラリの機能の概要が記載された spaCy 101 ガイドができました。

1 週間前にバージョン 2.0 にアップデートして以来、いくつかのバグを修正し、ビデオの追加、トレーニングのヒントと提案のセクションの更新などによりドキュメントをさらに更新するバージョン 2.0.3 がリリースされました。

先週 Github で最も人気のある他の 5 つのプロジェクト (トレンドランキングに基づく。興味のある方は、Github でプロジェクト名を直接検索して詳細情報を確認できます)。

  • Git フライトルール: Git を使用するためのプログラマー向けガイド。何か問題が発生した場合、開発者はプロジェクトを調べて、何ができるかを確認できます。

  • 機械学習の問題に対する最先端の結果: 名前が示すように、SoTA はすべての機械学習の問題を解決できます。

  • Node のベスト プラクティス: Node.js のベスト プラクティスのリスト

  • JS コードから SVG フローチャート: JS コードを SVG フローチャートに変換するための視覚化ライブラリ。

  • Tensorflow: 機械学習用のオープンソース ソフトウェア ライブラリ。

<<:  深層強化学習入門: TensorFlow で初めてのゲーム AI を構築する

>>:  卒業後すぐに年収56万は貰えるんですか?右! Twitterの機械学習の専門家が書いた上級マニュアルをご覧ください

ブログ    

推薦する

WuDao 2.Oがリリースされ、中国語を中核とする大規模な事前学習済みモデルプラットフォームエコシステムを構築

【51CTO.comオリジナル記事】​​​ GPT-3は昨年5月にリリースされました。 OpenAI...

Google、再生可能エネルギーと機械学習の力を借りて風力発電の予測に成功

従来の観点から見ると、目に見えず、実体のない風が新しい日にどのような挙動を示すかを予測することは依然...

DGX-2 および SXM3 カードが GTC 2018 で発表されました

最近、GTC 2018 で、Vicor チームは NVIDIA DGX-2 の発表を目撃しました。 ...

...

...

...

人工知能と5Gの組み合わせは医療業界の診断と治療のモデルとプロセスを変えるだろう

COVID-19の世界的パンデミックにより、医療におけるテクノロジーの活用が加速しました。 2021...

IDC、2021年の中国の人工知能市場に関する10の予測を発表

インターナショナル・データ・コーポレーション(IDC)は、「IDC FutureScape:世界の人...

マルチラベル分類とは何ですか?ここにいくつかの実用的な古典的な方法があります

これはおそらく、マルチラベル分類のための最も実用的なヒントです。ご存知のとおり、バイナリ分類タスクは...

人工知能は中国の製造業にどのような変化をもたらすのでしょうか?

[[260379]]データマップ:中国航空宇宙科学産業集団第三科学院第35研究所が開発に成功した新...

ロボットの認識システムはどのように機能するのでしょうか?

ビジュアルサーボシステムは、視覚情報をフィードバック信号として使用し、ロボットの位置と姿勢を制御およ...

ニューラルネットワークの過剰適合を避ける 5 つのテクニック

この記事では、ニューラル ネットワークをトレーニングするときに過剰適合を回避する 5 つの手法を紹介...

Google の大きな動き!新しくリリースされた Cloud AutoML により、コードを書かずに AI トレーニングを完全自動化

これは大問題だ! Google が大きな動きを見せました!昨日、フェイフェイ・リーとジェフ・ディーン...

440億ドル!マスク氏がツイッター買収に成功 トランプ氏「アカウントが復活してもツイッターは使わない」

4月26日、海外メディアの報道によると、2週間後、マスク氏によるツイッター買収がようやく決着した。...