1008 個の機械翻訳モデルが一挙にリリース、GitHub で最も人気のある NLP プロジェクトがアップデート: 140 の言語の組み合わせをカバー

1008 個の機械翻訳モデルが一挙にリリース、GitHub で最も人気のある NLP プロジェクトがアップデート: 140 の言語の組み合わせをカバー

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

GitHub で最も人気のある NLP プロジェクトを機械翻訳に使用できるようになりました。

はい、 26.9k 個の星が付いた Hugging Face Transformer プロジェクトです。最新のアップデートバージョンでは、Baobaolianは1008モデルをリリースし、正式に機械翻訳の分野に参入しました。

このモデルは、中国語から英語、英語からフランス語、フランス語からアラビア語など、140 種類の言語の組み合わせをカバーしており、1 対多の翻訳も可能です。

このような:

HugFaceの創設者クレメント・デラング氏はこう語った。

私たちのオープンソース プロジェクトを利用している人は世界中にたくさんおり、NLP コミュニティにはさまざまな言語を話す人々がますます集まっています。

これにより、モデル内で他の言語へのアクセスを提供するだけでなく、翻訳も提供する必要があることがわかりました。

1008 個の機械翻訳モデル

Baobaolian 氏によると、これらの 1,000 以上のモデルは、教師なし学習とOPUS データセットを使用して研究者によってトレーニングされたとのことです。

OPUS プロジェクトは、ヘルシンキ大学とその世界的なパートナーによって立ち上げられ、さまざまな言語データセット、特にリソースの少ない (少数言語) データセットを収集してオープンソース化することを目的としています。

部分モデル

さらに、HugFace は人気の Seq2Seq モデルを Transformer プロジェクトに追加しました。

たとえば、Google AI のT5や Facebook のBART などです

使い方は相変わらず簡単です。

たとえば、 opus-mt-en-ROMANCEモデルを使用すると、1 つの API で英語をフランス語に、英語をポルトガル語に、英語をスペイン語に同時に翻訳できます。

一部のネットユーザーは「時間を節約するのに最適なツールだ」とコメントした。

ハグフェイストランスフォーマーについて

HugFace の Transformer Python ライブラリには現在 500,000 を超える pip インストールがあり、SQuAD リーダーボード上のすべての最高の言語モデルが含まれています。

たとえば、Google AI の BERT、XLNet、Facebook AI の RoBERTa、OpenAI の GPT-2 などです。

使い方は簡単で、必要なインポートは 1 回だけです。

TensorFlow 2.0 と PyTorch 間の深い相互運用性をサポートします。

リアルタイムでプレイできるオンラインデモもあります。

この Wanxing プロジェクトを使用した NLP ユーザーは皆、これが良いと言っています。

今すぐ使いますか?

ポータル

GitHub プロジェクト: https://github.com/huggingface/transformers

<<:  人工知能はソフトウェア開発のパラダイムを変えている

>>:  ArcSoft Open Platformの新しいアルゴリズムは、顔認識セグメンテーションのシナリオの拡張に役立ちます

ブログ    
ブログ    
ブログ    

推薦する

人工知能は社会統治の近代化を効果的に促進できる

現在、人類は急速に人工知能の時代に突入しています。人工知能技術の急速な発展、モノのインターネット、ビ...

AI時代に誰かが密かにあなたの顔を真似している

人工知能の時代音声、指紋、顔認識など。 AI技術は飛躍的に進歩している犯罪者もこれに気づいているこの...

額をタップして入力できる。Googleエンジニアの「帽子型キーボード」は数え切れないほどのファンを魅了。自分で作ることもできる

キーボードと帽子を組み合わせたらどうなるでしょうか?冗談はさておき、Google 日本支社のエンジニ...

人工知能を活用して会社のウェブサイトをより良く作成する方法

ここでは、テクノロジーの進歩に合わせて AI を使用して、より発展し、より強力になる Web サイト...

ドイツの中小企業の35%以上がすでに人工知能技術を活用

序文ドイツ連邦政府は2018年に「ドイツ人工知能開発戦略」を発表し、人工知能分野におけるドイツの研究...

ビッグデータの発展は、ソフトウェアエンジニアの漸進的な衰退とアルゴリズムエンジニアの台頭を伴うことになる。

[[190402]]ビッグデータは人類の歴史のどの時代にも存在していましたが、テクノロジーが一定の...

ダボにおけるタイムホイールアルゴリズムの応用

[[346568]] 1 スケジュールされたタスクNetty、Quartz、Kafka、Linux ...

ChatGPT と ReactJS を統合してよりスマートな会話型インターフェースを実現

翻訳者 |李睿レビュー | Chonglouテクノロジーの世界が進化し続けるにつれて、チャットボット...

自動運転車の危険性: 自動運転車が世界中で実現できないのはなぜか

テスラは2020年10月、車の所有者が駐車し、巡航速度で車線を自動的に維持し、赤信号で停止することを...

優れたオープンソース画像背景除去プログラム8選

画像背景除去プログラムは、画像内の被写体と背景を自動的に分割し、背景を除去することによって機能します...

自動運転分野でファーウェイの「異常運転行動」関連特許が認可:認識精度向上が可能

昨日12月8日、華為技術有限公司は「異常運転行動を識別する方法」の特許権を取得し、公開番号はCN11...

...

脅威検出システムにAIを統合するメリット

サイバー脅威は高度化、蔓延しているため、企業は常に警戒を怠ってはなりません。 2022年には、4億9...