Google翻訳カーネルのアップグレードによりエラー率が55%以上低下したと主張

Google翻訳カーネルのアップグレードによりエラー率が55%以上低下したと主張

最近、Google 翻訳はひっそりと翻訳コアをアップグレードしました。 Google が提供する公式データによると、Google 翻訳で使用されている Google ニューラル マシン トランスレーション (GNMT) システムは、現在利用可能な最も高度なトレーニング テクノロジを使用しており、これにより機械翻訳のレベルが向上し、翻訳エラーがさらに 55%~85% 削減されます。

Googleの翻訳モデルの品質

10 年以上前、Google は Google 翻訳をリリースしました。初期の頃は、フレーズベースの統計的機械翻訳によって、入力された文章が単語やフレーズに分解され、個別に翻訳されていました。この翻訳方法の欠点は非常に明白です。文中の元々完全な情報が断片化され、首尾一貫して表現できないのです。この現象は、英語と中国語間の翻訳において特に顕著です。

一方、Google ニューラル機械翻訳は、入力された文全体を翻訳します。

中国語から英語への翻訳を例にとると、Google ニューラル機械翻訳はまずこの中国語の文章内の単語をベクトルのリストにエンコードします。各ベクトルは、これまでに読み取られたすべての単語の意味を表します (エンコーダー)。文章全体を読み終えると、デコーダーが動作を開始し、英語の文章を 1 単語ずつ生成します (デコーダー)。

上図はGoogleニューラル機械翻訳の中国語-英語翻訳原理を示している。

各ステップで正しい翻訳された単語を生成するために、デコーダーは、生成された英語の単語に最も関連性の高い中国語ベクトルの重み分布に焦点を当てます。

最初に提案されたとき、ニューラル機械翻訳システムは、中規模のデータセットではフレーズベースの翻訳システムに匹敵するものでした。

Google は現在、ニューラル機械翻訳によって非常に大規模なデータセットを扱う際の多くの課題を克服し、より高速かつより正確に翻訳できるシステムを構築したと発表している。

現在、中国語から英語への翻訳にはGoogleのニューラル機械翻訳システムが利用されています。 Google 翻訳は現在、モバイルとウェブ上での中国語から英語への翻訳にニューラル機械翻訳を使用しており、1 日あたり約 1,800 万件の翻訳が行われています。

大規模なデータセットでテストされた Google のニューラル機械翻訳システムを搭載した最新の Google 翻訳は、どれほど効果的なのでしょうか?

簡単な比較テストを行いました。もちろん、これはまだ中国語から英語への翻訳のシナリオです。

テストシナリオ: PC側Google翻訳ウェブバージョン

英語のメッセージがランダムに選択され、元のテキストは次のとおりです。

COVID-19 が始まって以来、小売業やブランド製造業のパートナーからは、消費者の需要の変動を踏まえ、消費者の関心がどのように変化しているかについて、より詳しい情報を求めているという声が寄せられています。こうした変化は、Google での検索方法に反映されています。先月は、人々が自宅で過ごす時間が増えたため、家庭用品やジグソーパズルの検索関心が急増しました。今月は、米国ではミシンやベーキング用品、英国とオーストラリアではテザーボール セットやチョークへの関心が急増しました。

企業は、Google トレンド、ソーシャル リスニング、アンケート、自社データなど、さまざまなリソースを活用して消費者の関心の変化を把握し、即座に意思決定を行っています。しかし、何を探せばよいかがわからなければ、どの製品カテゴリが人気を集めているのか、またそれがチャンスとなる可能性があるのか​​を簡単には理解できません。

そのため、Think with Google で急成長中の小売カテゴリ ツールをリリースします。このツールは、Google 検索で急成長している商品関連カテゴリ、そのカテゴリが成長している場所、関連する検索語句を表示します。人々が検索している商品カテゴリに関するこのような分析情報を提供するのは今回が初めてです。

Google 翻訳の旧バージョンによる英語 - 中国語の翻訳結果:

アップグレード後の Google 翻訳による新しい英語 - 中国語翻訳結果。赤でマークされた部分は、以前の翻訳結果と異なります。新しい翻訳は次のとおりです。

2つの翻訳結果を比較すると、大きな違いがあることがわかります。全体的に、新しい翻訳結果で赤でマークされた表現は、明らかに中国語の文法や表現習慣に沿っています。

さらに、最後の段落の翻訳結果の最適化がより顕著になり、Google の製品名「Think with Google」が正確に識別され、ランダム翻訳の恥ずかしさが回避されました。

確かに賢いですね!

<<:  プロセス産業におけるグリーン製造における人工知能の機会と課題

>>:  IoT、AI、ブロックチェーンがビジネス経済を変革する

ブログ    

推薦する

ディープラーニングでは複素数を使うべきでしょうか?

マンデルブロ複素集合: https://en.wikipedia.org/wiki/Mandelbr...

...

...

Python ベースのパーセプトロン分類アルゴリズムの実践

[[374354]]パーセプトロンは、バイナリ分類タスク用の線形機械学習アルゴリズムです。これは、人...

杜暁曼自動機械学習プラットフォームの実践

1. 機械学習プラットフォームまず、Du Xiaomanの機械学習プラットフォームの背景、開発プロセ...

...

実現可能な AI、SF から科学的事実へ: 今日の AI の現実

人工知能(AI)の概念は何千年も前から存在しています。 AI の物語は歴史を通じて世界中に広がってい...

...

最高の AI スタートアップはどれですか? 6つの選択肢があなたに方向性を与える

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

ディープラーニングによる時系列モデルの評価

技術概要:今回は主に教師なし特徴学習とディープラーニングの最近の発展と、時系列モデル問題におけるそれ...

CES 2018: 見逃せない 4 つの主要なテクノロジー トレンド

[[214658]] 2週間後、2018 CESがラスベガスで開幕します。今年と同様に、CES 20...

人工知能の分野では、すでに世界中で 10 個の画期的な技術が存在します。

[[238191]]人工知能はハイテクで、多岐にわたり、多次元的で、学際的な統合装置であり、ビッグ...

多くの人がまだブロックチェーンについて漠然とした理解しか持っていない中、これらのブロックチェーンの応用シナリオはすでに実装されている。

1.ブロックチェーン + IP著作権最近、フェニックスオンライン書店は「フェニックスエッグ」と呼ば...

人工知能、機械学習、ディープラーニングをどのように区別するのでしょうか?

この記事は、LDV Partners のパートナーであるシリコンバレーの投資家レイク・ダイ氏によるも...