Google翻訳カーネルのアップグレードによりエラー率が55%以上低下したと主張

Google翻訳カーネルのアップグレードによりエラー率が55%以上低下したと主張

最近、Google 翻訳はひっそりと翻訳コアをアップグレードしました。 Google が提供する公式データによると、Google 翻訳で使用されている Google ニューラル マシン トランスレーション (GNMT) システムは、現在利用可能な最も高度なトレーニング テクノロジを使用しており、これにより機械翻訳のレベルが向上し、翻訳エラーがさらに 55%~85% 削減されます。

Googleの翻訳モデルの品質

10 年以上前、Google は Google 翻訳をリリースしました。初期の頃は、フレーズベースの統計的機械翻訳によって、入力された文章が単語やフレーズに分解され、個別に翻訳されていました。この翻訳方法の欠点は非常に明白です。文中の元々完全な情報が断片化され、首尾一貫して表現できないのです。この現象は、英語と中国語間の翻訳において特に顕著です。

一方、Google ニューラル機械翻訳は、入力された文全体を翻訳します。

中国語から英語への翻訳を例にとると、Google ニューラル機械翻訳はまずこの中国語の文章内の単語をベクトルのリストにエンコードします。各ベクトルは、これまでに読み取られたすべての単語の意味を表します (エンコーダー)。文章全体を読み終えると、デコーダーが動作を開始し、英語の文章を 1 単語ずつ生成します (デコーダー)。

上図はGoogleニューラル機械翻訳の中国語-英語翻訳原理を示している。

各ステップで正しい翻訳された単語を生成するために、デコーダーは、生成された英語の単語に最も関連性の高い中国語ベクトルの重み分布に焦点を当てます。

最初に提案されたとき、ニューラル機械翻訳システムは、中規模のデータセットではフレーズベースの翻訳システムに匹敵するものでした。

Google は現在、ニューラル機械翻訳によって非常に大規模なデータセットを扱う際の多くの課題を克服し、より高速かつより正確に翻訳できるシステムを構築したと発表している。

現在、中国語から英語への翻訳にはGoogleのニューラル機械翻訳システムが利用されています。 Google 翻訳は現在、モバイルとウェブ上での中国語から英語への翻訳にニューラル機械翻訳を使用しており、1 日あたり約 1,800 万件の翻訳が行われています。

大規模なデータセットでテストされた Google のニューラル機械翻訳システムを搭載した最新の Google 翻訳は、どれほど効果的なのでしょうか?

簡単な比較テストを行いました。もちろん、これはまだ中国語から英語への翻訳のシナリオです。

テストシナリオ: PC側Google翻訳ウェブバージョン

英語のメッセージがランダムに選択され、元のテキストは次のとおりです。

COVID-19 が始まって以来、小売業やブランド製造業のパートナーからは、消費者の需要の変動を踏まえ、消費者の関心がどのように変化しているかについて、より詳しい情報を求めているという声が寄せられています。こうした変化は、Google での検索方法に反映されています。先月は、人々が自宅で過ごす時間が増えたため、家庭用品やジグソーパズルの検索関心が急増しました。今月は、米国ではミシンやベーキング用品、英国とオーストラリアではテザーボール セットやチョークへの関心が急増しました。

企業は、Google トレンド、ソーシャル リスニング、アンケート、自社データなど、さまざまなリソースを活用して消費者の関心の変化を把握し、即座に意思決定を行っています。しかし、何を探せばよいかがわからなければ、どの製品カテゴリが人気を集めているのか、またそれがチャンスとなる可能性があるのか​​を簡単には理解できません。

そのため、Think with Google で急成長中の小売カテゴリ ツールをリリースします。このツールは、Google 検索で急成長している商品関連カテゴリ、そのカテゴリが成長している場所、関連する検索語句を表示します。人々が検索している商品カテゴリに関するこのような分析情報を提供するのは今回が初めてです。

Google 翻訳の旧バージョンによる英語 - 中国語の翻訳結果:

アップグレード後の Google 翻訳による新しい英語 - 中国語翻訳結果。赤でマークされた部分は、以前の翻訳結果と異なります。新しい翻訳は次のとおりです。

2つの翻訳結果を比較すると、大きな違いがあることがわかります。全体的に、新しい翻訳結果で赤でマークされた表現は、明らかに中国語の文法や表現習慣に沿っています。

さらに、最後の段落の翻訳結果の最適化がより顕著になり、Google の製品名「Think with Google」が正確に識別され、ランダム翻訳の恥ずかしさが回避されました。

確かに賢いですね!

<<:  プロセス産業におけるグリーン製造における人工知能の機会と課題

>>:  IoT、AI、ブロックチェーンがビジネス経済を変革する

ブログ    
ブログ    

推薦する

ディープラーニングの簡単な歴史: TF と PyTorch の独占、次の 10 年間の黄金時代

過去 10 年間で、機械学習 (特にディープラーニング) の分野では多数のアルゴリズムとアプリケーシ...

ワンクリックで細い毛を切り取る。これはAdobeの最新のAI切り抜きアルゴリズムで、近日公開予定

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

6つの主要なソートアルゴリズム

6 つの一般的なソート アルゴリズムの GIF アニメーションがあり、ソートの考え方をより簡単に理解...

...

...

北京大学の王一州氏:信頼できるAI研究の名刺を磨くには、産業界、学界、研究機関の連携が必要

人工知能(AI)は1950年代に誕生し、3つの発展の波を経てきました。研究段階から大規模な産業化段階...

SSD ソリッド ステート ドライブの構造: マスター制御アルゴリズム、ファームウェア、NAND フラッシュ メモリ

SSD ソリッド ステート ドライブは近年のストレージ技術における大きな進歩であり、コンピューターの...

ビジネスアナリストにとってAIが意味するもの

[[275322]]今日では、人工知能はもはや流行語ではなく、多くの環境ビジネスアナリストやその他の...

Ctrip旅行言語モデルシステムの紹介と応用

著者についてCtrip の自然言語処理と大規模言語モデル アルゴリズムの専門家である Terry は...

...

...

清華大学張北院士:融合乗算による第三世代人工知能の三空間融合モデルの解釈

人工知能は今どの段階に達しているのでしょうか?どのような問題や限界があるのか​​?どのように突破する...

Pythonでグラフを描いてニューラルネットワークを理解する

Python 中国語コミュニティ (ID: python-china)人工ニューラル ネットワーク ...