今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

先週、Github で最も人気のあるプロジェクトは、最近バージョン 2.0 に更新された自然言語処理 Python ライブラリ spaCy でした。 SpaCy は、自然言語処理の研究に基づいて作成されたオープンソース プロジェクトであり、最終的には実際の製品やソリューションに使用することを目的としています。バージョン 2.0 では、新しいニューラル ネットワーク モデル、より多くの言語のサポート、ドキュメントの改善など、いくつかの新機能が追加されています。

SpaCy の作者である Matthew Honnibal 氏は、リリース ノートで、新しいバージョンでは最先端のディープラーニング技術を使用して spaCy が更新され、スケーラブルなクラウド コンピューティング ワークフローで spaCy を実行しやすくなると書いています。

新しいバージョンには、7 つ以上の言語に対応した 13 のニューラル ネットワーク モデルが含まれています。また、8 つの新しい言語 (英語、ドイツ語、スペイン語、ポルトガル語、フランス語、イタリア語、オランダ語、多言語 NER) のアルファ トークン化サポートも追加されました。小さなテーブルで大きな語彙をサポートするために、ブルーム埋め込み戦略を使用します。コア ニューラル ネットワーク モデルには品詞タグ、依存タグ、名前付きエンティティが含まれ、小規模モデルにはコンテキスト固有のトークン ベクトルのみが含まれ、中規模モデルには単語ベクトルが含まれます。

このバージョンでは、使用ガイド、API ドキュメント、コード例のほとんどが書き直されました。ドキュメントには、カスタム処理パイプライン、視覚化ツール、トレーニング チュートリアル、単語ベクトル、ルールベースのマッチングに関する情報が含まれています。重要な概念の説明と図解、およびライブラリの機能の概要が記載された spaCy 101 ガイドができました。

1 週間前にバージョン 2.0 にアップデートして以来、いくつかのバグを修正し、ビデオの追加、トレーニングのヒントと提案のセクションの更新などによりドキュメントをさらに更新するバージョン 2.0.3 がリリースされました。

先週 Github で最も人気のある他の 5 つのプロジェクト (トレンドランキングに基づく。興味のある方は、Github でプロジェクト名を直接検索して詳細情報を確認できます)。

  • Git フライトルール: Git を使用するためのプログラマー向けガイド。何か問題が発生した場合、開発者はプロジェクトを調べて、何ができるかを確認できます。

  • 機械学習の問題に対する最先端の結果: 名前が示すように、SoTA はすべての機械学習の問題を解決できます。

  • Node のベスト プラクティス: Node.js のベスト プラクティスのリスト

  • JS コードから SVG フローチャート: JS コードを SVG フローチャートに変換するための視覚化ライブラリ。

  • Tensorflow: 機械学習用のオープンソース ソフトウェア ライブラリ。

<<:  深層強化学習入門: TensorFlow で初めてのゲーム AI を構築する

>>:  卒業後すぐに年収56万は貰えるんですか?右! Twitterの機械学習の専門家が書いた上級マニュアルをご覧ください

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

スマート製造を活用して持続可能な工場フロアを構築するにはどうすればよいでしょうか?

自動車メーカーは、施設を近代化し、事業運営をより持続可能にするために、スマート製造戦略を採用していま...

データマイニングにおけるトップ10の古典的なアルゴリズム

国際的に有名な学術組織である IEEE 国際データマイニング会議 (ICDM) は、データマイニング...

完全なグラフが利用できない場合にグラフディープラーニングを使用するにはどうすればよいでしょうか?

多様体学習は、2000 年に有名な科学雑誌 Science で初めて提案されて以来、情報科学の分野に...

機械学習アルゴリズムと機械学習モデルの開発方法について知っておくべきことは何ですか?

[[201235]]概念とそれがビジネス目標に与える影響を学ぶことは非常に重要です。アルゴリズムの...

...

TensorFlow が素晴らしい機械学習データセット 30 選

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

...

3年間の車両インターネット無料化により、自動運転の産業化が加速

最近、国家発展改革委員会と財政部は、新技術と新事業の発展を奨励するために、5905-5925MHz周...

初めてmAP70%を突破! GeMap: ローカル高精度マップ SOTA が再び更新されました

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

人工知能が高齢者の日常生活に影響を与えないようにする

若者はさまざまなスワイプサービスに慣れてきましたが、これは高齢者に一連のトラブルをもたらしました。医...

人工知能とビッグデータが私たちの生活に何をもたらすかご存知ですか?

「ビッグデータ」と「人工知能」はテクノロジー業界で最も価値のある分野となっている。Apple、Go...

インテリジェントロボットにはどのような主要なセンサー技術が使用されていますか?

今日のロボットで重要な役割を果たしているいくつかの主要なセンサー技術には、磁気位置センサー、存在セン...

マイクロソフト、進化拡散法を用いたタンパク質生成のための新しい AI フレームワーク EvoDiff をオープンソース化

進化により、細胞プロセスを正確に制御する多様な機能性タンパク質が生み出されました。近年、この多様性か...