spaCy は、最先端の研究に基づいて構築され、実際の製品での使用のためにゼロから設計された、Python と Cython の高度な自然言語処理ライブラリです。 spaCy には、事前トレーニング済みの統計モデルと単語ベクトルが付属しており、現在 20 を超える言語でのトークン化をサポートしています。世界最速のパーサー、タグ付け、解析、固有表現認識のための畳み込みニューラル ネットワーク モデル、およびディープラーニングとの統合を特徴としています。これは、MIT ライセンスに基づいてリリースされた商用オープンソース ソフトウェアです。 spaCy プロジェクトは @honnibal と @ines によって管理されていますが、電子メールによる個人的なサポートは利用できません。しかし、オープンソース開発者は、公開して共有すれば、その支援の価値が高まり、より多くの人が恩恵を受けることができると考えています。 (公式 Github アドレス: https://github.com/explosion/spaCy#spacy-industrial-strength-nlp) spaCyの特徴:
spaCyのインストール ピップ pip を使用すると、spaCy バージョンは現在ソース パッケージとしてのみ利用できます。
pip を使用する場合は、システム状態の変更を避けるために、通常、仮想環境にパッケージをインストールすることをお勧めします。
コンダ コミュニティ開発者の努力により、conda サポートがようやく復活しました。 spaCy は conda-forge 経由でインストールできるようになりました。
spaCyの更新 spaCy の一部のアップデートでは、新しい統計モデルのダウンロードが必要になる場合があります。spaCy v2.0 以降を実行している場合は、validate コマンドを使用して、インストールされているモデルに互換性があるかどうかを確認し、互換性がない場合は、アップデート方法の詳細を出力できます。
独自のモデルをトレーニングした場合は、トレーニングと実行時の入力が一致する必要があることに注意してください。 spaCy を更新した後は、新しいバージョンでモデルを再トレーニングすることをお勧めします。 モデルをダウンロード v1.7.0 以降では、spaCy のモデルを Python パッケージとしてインストールできます。つまり、他のモジュールと同様に、アプリケーションのコンポーネントになります。 モデルは、spaCy のダウンロード コマンドを使用するか、pip にパスまたは URL を指定して手動でインストールできます。 モデルの読み込みと使用 モデルをロードするには、モデルのショートカット リンクで spacec.load() を使用します。 すでに pip 経由でモデルをインストールしている場合は、それを直接インポートして load() メソッドを呼び出すこともできます。 旧バージョンのサポート 古いバージョン (v1.6.0 以下) を使用している場合でも、python -m spacy.en.download all または python -m spacy.de.download all を使用して、spaCy から古いモデルをダウンロードしてインストールできます。 v1.6.0 リリースには .tar.gz アーカイブも添付されています。モデルを手動でダウンロードしてインストールするには、アーカイブを解凍し、含まれているディレクトリを spacy/data に配置し、spacy.load('en') または spacy.load('de') でモデルをロードします。 ソースからのコンパイル spaCy をインストールする別の方法は、GitHub リポジトリをクローンしてソースからビルドすることです。 コード ベースに変更を加える場合、一般的なアプローチは、ヘッダー ファイル、コンパイラ、pip、virtualenv、git を含む Python ディストリビューションで構成された開発環境を確保することです。コンパイラ部分が最も難しいです。これを実行する方法はシステムによって異なります。詳細については、Ubuntu、OS X、Windows の手順を参照してください。 pip による通常のインストールと比較して、requirements.txt では Cython などの開発者依存関係も追加でインストールされます。 詳細と手順については、ソースから spaCy をコンパイルするドキュメントと、プラットフォームと Python バージョンに適したコマンドのクイックスタート ウィジェットを参照してください。上記の詳細なコマンドの代わりに、以下の構造化されたコマンドを使用することもできます。すべてのコマンドは、仮想環境が .env というディレクトリにあることを前提としています。別のディレクトリを使用している場合は、環境変数 VENV_DIR を使用して変更できます。たとえば、VENV_DIR=".custom-env" fab clean make です。 ウブントゥ apt-get 経由でシステムレベルの依存関係をインストールします。
macOS / OS X いわゆる「コマンドライン ツール」を含む、最新バージョンの XCode をインストールします。 macOS と OS X には Python と git がプリインストールされています。 ウィンドウズ Python インタープリターのコンパイルに使用したバージョンと一致する Visual Studio Express 以降のバージョンをインストールします。公式ディストリビューションは、VS 2008 (Python 2.7)、VS 2010 (Python 3.4)、VS 2015 (Python 3.5) です。 テストの実行 spaCy には広範なテスト スイートが付属しています。 まず、spaCy がインストールされている場所を確認します。
次にそのディレクトリで実行します。 --vectors、--slow、および --model フラグはオプションであり、追加のテストを有効にします。
|
<<: TensorFlow とオートエンコーダー モデルを使用して手書き数字を生成する方法
>>: 単一画像超解像におけるディープラーニングの応用: SRCNN、知覚損失、SRResNet
2017年、『エコノミスト』誌は、石油ではなくデータが世界で最も価値のある資源になったと宣言しました...
キャピタル グループは、1931 年、大恐慌の真っ只中にカリフォルニア州ロサンゼルスで設立され、現在...
画像スタイルの転送?声の感情移入?いいえ、それはイメージの感情的な伝達です。コンピュータビジョンの分...
[[221404]] 3月3日午後9時30分、全国人民代表大会の代表でテンセント会長の馬化騰氏が黒...
顔認識とは、顔の特徴情報の本人分析を利用して本人認証を行う生体認証技術を指します。人気の生体認証技術...
有名アイドルプロジェクト「ラブライブ!」がAI論文を発表しました。そうです。最近、プレプリント論文プ...
[[235638]]人工知能は、誰もが「データ サイエンティスト」になるという、2、3 年前のビッ...
[[266892]]中国共産党第19回全国代表大会の最新報告は、教育の近代化と教育の情報化の流れに対...
消費者は、利便性、安全性、ユーザーエクスペリエンスを向上させる進歩を飽くなき欲求で求めています。ヒュ...
運転するには運転免許証を持っていることが前提条件であり、運転免許証を取得するには運転免許試験を受ける...
ビジュアル AI 分野の開発者にとって、適切なアルゴリズムを選択することはプロジェクトの戦いの半分を...
11月10日、マイクロソフトは人工知能研究企業OpenAIに100億ドル以上を投資したにもかかわらず...
予測分析プロジェクトを成功させるには、ソフトウェアを導入してそれを使用してデータを分析するだけではあ...