AIは地球上のあらゆる言語を翻訳できるよう自ら学習できる

AIは地球上のあらゆる言語を翻訳できるよう自ら学習できる

fastcompany によると、最近登場した 2 つの機械翻訳システムは、人間が翻訳したテキストからの学習教材を必要とせずに、地球上のあらゆる言語の翻訳を自律的に学習できるという、新たなブレークスルーを達成したとのことです。機械翻訳は劇的に進歩しましたが、翻訳者のドロップダウン メニューに自分の言語が表示されないため、その恩恵を享受できない人が地球上にはまだ何億人もいます。

現在、スペインのバスク大学(UPV)とカーネギーメロン大学(CMU)の2つの新しいAIシステムが、この状況をすべて変え、スタートレックのような真の万能翻訳機への扉を開くと期待されています。

[[212151]]

これらの新しいシステムの可能性を理解するには、まず現在の機械翻訳がどのように機能するかを理解することが重要です。 現在、機械翻訳の事実上の標準となっているのは Google 翻訳で、アフリカーンス語からズールー語まで、世界のトップ 10 言語 (順に、中国語、スペイン語、英語、ヒンディー語、ベンガル語、ポルトガル語、ロシア語、日本語、ドイツ語、ジャワ語) を含む 103 の言語をカバーしています。

Google のシステムは、人間が監督するニューラル ネットワークを使用して、以前に人間が翻訳した書籍や記事などの並列テキストを比較します。 Google 翻訳は、これらの並列テキストからの大量のデータを比較することで、任意の 2 つの言語間の同等性を学習し、それらの言語間での迅速な変換機能を獲得します。翻訳がおかしくなったり、原文の意味を正確に反映していない場合もありますが、全体的には機能的で、時間の経過とともに改善されています。

Google のアプローチは優れていて効果的です。しかし、残念ながら、どこでも利用できるわけではありません。

その理由は、教師ありトレーニングには長い時間がかかり、多くの教師が必要になるためです。教師の数が非常に多いため、Google はクラウドソーシングを使用しています。また、世界中のすべての言語間の対訳テキストが十分ではないためです。考えてみてください。世界言語の民族学目録によると、地球上には 6,909 の現存する言語があります。そのうち414種は人類の94%が利用しています。 Google 翻訳は 103 言語をカバーしているため、機械翻訳が利用できない言語は 6,806 言語となり、そのうち 311 言語には 100 万人を超える話者がいる。合計すると、少なくとも 8 億人が自動機械翻訳の恩恵を享受できません。

あらゆる言語間で単語や文章を翻訳できるこの2つの新しいシステムは、人間が翻訳した大量の対訳テキストを比較して学習する必要がない。また、監督も必要ありません。代わりに、彼らは教師なし機械学習を使用し、さまざまな言語のランダムなテキストを比較しました。これはどのように作動しますか?言語の単語の分類は似ているため、システムは単語が同等であるかどうかを推測し、この情報を使用して翻訳辞書を構築します。彼らは文の構造を理解し、異なる言語間で翻訳することで推測を評価しました。

UPV の研究者 Mikel Artetxe 氏は次のように説明しています。「中国語の本とアラビア語の本を大量に渡したと想像してください。重複する部分はまったくありません。そして、その人が中国語をアラビア語に翻訳することを学ばなければならないとしたらどうでしょう。それは不可能に思えますよね?」実際、それはあまりにも不可能に思えるため、Microsoft の AI 専門家 Di He (両研究プロジェクトにインスピレーションを与えた人物) は Science 誌に、「コンピューターは人間の監督なしでも翻訳を学習できる」と知って衝撃を受けたと語っています。

1 つの注意点は、このシステムは現在の並列テキスト深層学習システムほど正確ではないということですが、Di He 氏が指摘するように、コンピューターが人間の指示なしにこれらすべての事実を推測できたという事実は、単純に驚くべきことです。 私たちはこの新しい学習方法の表面をほんの少しだけ触れただけです。近い将来、誰とでも相手の母国語で話せるようになる真の万能翻訳機が登場するかもしれない。それはもはやSFの世界の話ではなくなるだろう。

<<:  JavaScript による機械学習の例 10 選

>>:  ディープラーニングと通常の機械学習の違いは何ですか?

ブログ    
ブログ    
ブログ    

推薦する

ChatGPT をベースにしたインテリジェントな顧客サービス アシスタント

導入従来の顧客サービス分野は、手作業に大きく依存し、データ集約的であることが特徴です。大量のユーザー...

再トレーニングなしでモデルを6倍圧縮:数学者チームが新しい量子化法を提案

RUDN大学の数学者チームは、再トレーニングに余分なリソースを費やすことなく、ニューラルネットワーク...

具現化された知能の新時代! VLAは、UIナビゲーションとロボット操作を備えた最強の基本モデルMagmaを歓迎します

既存の大規模言語モデル、画像生成モデルなどは、少数のモーダルデータに対してのみ動作し、人間のように物...

人工知能があなたの好きな家を見つけるお手伝いをします

潜在的な購入者が住宅を閲覧したり、オンラインで検索したりする際に、エージェントやブローカーによる物件...

Facebookは27億人にサービスを提供するAIハードウェアシステムをオープンソース化した。

コミュニティは常に Facebook のハードウェア研究に細心の注意を払ってきました。本日の Ope...

あなたの AI は規制に対応できる準備ができていますか?

現在、人工知能 (AI) に関する同様の規制が世界中の複数の地域で施行され始めており、GDPR に関...

人工知能トレーナーという職業は魅力的ですか?

人工知能については誰もが知っていますが、人工知能トレーナーについてはどのくらい知っていますか? [[...

AIチップとは何ですか?人々が知っておくべきことすべて

[51CTO.com クイック翻訳] 業界の専門家は、音声アシスタント、顔認識カメラ、コンピューター...

AIが宇宙飛行士の健康を宇宙で監視する方法

[[286902]] ▲ 火星探査機ロゼッタが光学スペクトル赤外線リモートイメージングシステム(OS...

MITの新しいAI研究:セーターが編めなくても問題ない、AIにやらせればいい

人工知能といえば、最先端のクールなアプリケーションのほかに、この話題になると「偽物」という言葉が思い...

役に立たない、それとも翻訳ツール?日本が「会話」できるスマートマスクを発明

マスクが翻訳機の仕事を引き継ごうとしている。 最近、日本のスタートアップ企業が、マスクを着けていると...

...

Cloudsimを使用して多次元QoSに基づくリソーススケジューリングアルゴリズムを実装する

Cloudsim は、グリッドコンピューティングシミュレーションソフトウェア Gridsim のプロ...

...

認知と論理的思考の観点から自然言語理解を議論する

[[425002]]自然言語理解 (NLU) は難しい問題です。数十年前の AI の誕生から現在に至...