fastcompany によると、最近登場した 2 つの機械翻訳システムは、人間が翻訳したテキストからの学習教材を必要とせずに、地球上のあらゆる言語の翻訳を自律的に学習できるという、新たなブレークスルーを達成したとのことです。機械翻訳は劇的に進歩しましたが、翻訳者のドロップダウン メニューに自分の言語が表示されないため、その恩恵を享受できない人が地球上にはまだ何億人もいます。 現在、スペインのバスク大学(UPV)とカーネギーメロン大学(CMU)の2つの新しいAIシステムが、この状況をすべて変え、スタートレックのような真の万能翻訳機への扉を開くと期待されています。
これらの新しいシステムの可能性を理解するには、まず現在の機械翻訳がどのように機能するかを理解することが重要です。 現在、機械翻訳の事実上の標準となっているのは Google 翻訳で、アフリカーンス語からズールー語まで、世界のトップ 10 言語 (順に、中国語、スペイン語、英語、ヒンディー語、ベンガル語、ポルトガル語、ロシア語、日本語、ドイツ語、ジャワ語) を含む 103 の言語をカバーしています。 Google のシステムは、人間が監督するニューラル ネットワークを使用して、以前に人間が翻訳した書籍や記事などの並列テキストを比較します。 Google 翻訳は、これらの並列テキストからの大量のデータを比較することで、任意の 2 つの言語間の同等性を学習し、それらの言語間での迅速な変換機能を獲得します。翻訳がおかしくなったり、原文の意味を正確に反映していない場合もありますが、全体的には機能的で、時間の経過とともに改善されています。 Google のアプローチは優れていて効果的です。しかし、残念ながら、どこでも利用できるわけではありません。 その理由は、教師ありトレーニングには長い時間がかかり、多くの教師が必要になるためです。教師の数が非常に多いため、Google はクラウドソーシングを使用しています。また、世界中のすべての言語間の対訳テキストが十分ではないためです。考えてみてください。世界言語の民族学目録によると、地球上には 6,909 の現存する言語があります。そのうち414種は人類の94%が利用しています。 Google 翻訳は 103 言語をカバーしているため、機械翻訳が利用できない言語は 6,806 言語となり、そのうち 311 言語には 100 万人を超える話者がいる。合計すると、少なくとも 8 億人が自動機械翻訳の恩恵を享受できません。 あらゆる言語間で単語や文章を翻訳できるこの2つの新しいシステムは、人間が翻訳した大量の対訳テキストを比較して学習する必要がない。また、監督も必要ありません。代わりに、彼らは教師なし機械学習を使用し、さまざまな言語のランダムなテキストを比較しました。これはどのように作動しますか?言語の単語の分類は似ているため、システムは単語が同等であるかどうかを推測し、この情報を使用して翻訳辞書を構築します。彼らは文の構造を理解し、異なる言語間で翻訳することで推測を評価しました。 UPV の研究者 Mikel Artetxe 氏は次のように説明しています。「中国語の本とアラビア語の本を大量に渡したと想像してください。重複する部分はまったくありません。そして、その人が中国語をアラビア語に翻訳することを学ばなければならないとしたらどうでしょう。それは不可能に思えますよね?」実際、それはあまりにも不可能に思えるため、Microsoft の AI 専門家 Di He (両研究プロジェクトにインスピレーションを与えた人物) は Science 誌に、「コンピューターは人間の監督なしでも翻訳を学習できる」と知って衝撃を受けたと語っています。 1 つの注意点は、このシステムは現在の並列テキスト深層学習システムほど正確ではないということですが、Di He 氏が指摘するように、コンピューターが人間の指示なしにこれらすべての事実を推測できたという事実は、単純に驚くべきことです。 私たちはこの新しい学習方法の表面をほんの少しだけ触れただけです。近い将来、誰とでも相手の母国語で話せるようになる真の万能翻訳機が登場するかもしれない。それはもはやSFの世界の話ではなくなるだろう。 |
>>: ディープラーニングと通常の機械学習の違いは何ですか?
[[400873]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
2018年が近づいてきました。2018年のテーマを大胆に予想すると、間違いなく人工知能が人気のテーマ...
6月21日のニュースによると、新たな研究により、人工知能(AI)は人気曲を正確に識別できることが示さ...
現在の大規模なビデオ運用および保守プロセスでは、CDN の故障したハード ドライブの交換が大きな問題...
[[443226]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
4月20日、Syncedは「量子コンピューティング」に関するオンライン円卓会議イベントに、中国科学院...
インテリジェント エッジは、スマート デバイスとモノのインターネットをデータ収集ポイントから、組織に...
今日は、非常に実用的な 5 つの指示を紹介します。これらの指示は、出力コンテンツの一貫性、記事のスタ...
過去 10 年間で、AI (人工知能) の分野は目覚ましい進歩を遂げており、NLP (自然言語処理)...