1008 個の機械翻訳モデルが一挙にリリース、GitHub で最も人気のある NLP プロジェクトがアップデート: 140 の言語の組み合わせをカバー

1008 個の機械翻訳モデルが一挙にリリース、GitHub で最も人気のある NLP プロジェクトがアップデート: 140 の言語の組み合わせをカバー

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

GitHub で最も人気のある NLP プロジェクトを機械翻訳に使用できるようになりました。

はい、 26.9k 個の星が付いた Hugging Face Transformer プロジェクトです。最新のアップデートバージョンでは、Baobaolianは1008モデルをリリースし、正式に機械翻訳の分野に参入しました。

このモデルは、中国語から英語、英語からフランス語、フランス語からアラビア語など、140 種類の言語の組み合わせをカバーしており、1 対多の翻訳も可能です。

このような:

HugFaceの創設者クレメント・デラング氏はこう語った。

私たちのオープンソース プロジェクトを利用している人は世界中にたくさんおり、NLP コミュニティにはさまざまな言語を話す人々がますます集まっています。

これにより、モデル内で他の言語へのアクセスを提供するだけでなく、翻訳も提供する必要があることがわかりました。

1008 個の機械翻訳モデル

Baobaolian 氏によると、これらの 1,000 以上のモデルは、教師なし学習とOPUS データセットを使用して研究者によってトレーニングされたとのことです。

OPUS プロジェクトは、ヘルシンキ大学とその世界的なパートナーによって立ち上げられ、さまざまな言語データセット、特にリソースの少ない (少数言語) データセットを収集してオープンソース化することを目的としています。

部分モデル

さらに、HugFace は人気の Seq2Seq モデルを Transformer プロジェクトに追加しました。

たとえば、Google AI のT5や Facebook のBART などです

使い方は相変わらず簡単です。

たとえば、 opus-mt-en-ROMANCEモデルを使用すると、1 つの API で英語をフランス語に、英語をポルトガル語に、英語をスペイン語に同時に翻訳できます。

一部のネットユーザーは「時間を節約するのに最適なツールだ」とコメントした。

ハグフェイストランスフォーマーについて

HugFace の Transformer Python ライブラリには現在 500,000 を超える pip インストールがあり、SQuAD リーダーボード上のすべての最高の言語モデルが含まれています。

たとえば、Google AI の BERT、XLNet、Facebook AI の RoBERTa、OpenAI の GPT-2 などです。

使い方は簡単で、必要なインポートは 1 回だけです。

TensorFlow 2.0 と PyTorch 間の深い相互運用性をサポートします。

リアルタイムでプレイできるオンラインデモもあります。

この Wanxing プロジェクトを使用した NLP ユーザーは皆、これが良いと言っています。

今すぐ使いますか?

ポータル

GitHub プロジェクト: https://github.com/huggingface/transformers

<<:  人工知能はソフトウェア開発のパラダイムを変えている

>>:  ArcSoft Open Platformの新しいアルゴリズムは、顔認識セグメンテーションのシナリオの拡張に役立ちます

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

人工知能トレーナーという職業は魅力的ですか?

人工知能については誰もが知っていますが、人工知能トレーナーについてはどのくらい知っていますか? [[...

GoogleはAIの訓練のために何億人ものアメリカ人のオンラインデータを盗んだとして集団訴訟に直面している

7月13日、新たな訴訟で、Googleがチャットボット「バード」などの人工知能(AI)製品のトレーニ...

...

...

時代遅れにならないで、機械学習プラットフォームこそが未来だ

機械学習と人工知能の急速な発展に伴い、業界では多くのオープンソースの機械学習プラットフォームが登場し...

Java 開発者のための機械学習の事例

翻訳者 |陳俊レビュー | Chonglou昨年以来、 ChatGPTやBardなどの大規模言語モデ...

自動化を推進するAIテストツール

テスト自動化における人工知能の使用は、品質保証業界を支配する最新のトレンドの 1 つです。実際、キャ...

ネイチャー長文記事:AIのブラックボックスを破るための「長期戦」

2020年2月、COVID-19が世界中で急速に広がり、抗原検査の入手が困難になったため、一部の医...

面接の質問に必ず読むべき一冊! Python のトップ 5 ソート アルゴリズムとその実装コード

ソートは、すべての IT エンジニアと開発者にとって不可欠な知識スキルです。コーディング面接に合格す...

マイクロソフトとOpenAIが訴えられた後、アップルはニュース出版社とAIモデルのトレーニング費用の支払いについて交渉している

Appleは、AIモデルのトレーニングと開発のためにニュース資料にアクセスするために、いくつかの国際...

新世代のAIがディープラーニングの問題を解決する

では、新世代の人工知能とは何でしょうか? 知能とは、学習する能力と問題を解決する能力です。学習は問題...

...

Swift モバイル ゲーム開発に適用される幅優先探索アルゴリズム

[51CTO.com クイック翻訳] Swift Algorithm Club (https://g...

2024 年に向けた 6 つの生成 AI 予測

アナリストの Mike Leone 氏は、オープンソースから規制の変化まで、生成 AI の今後を予測...