最近、Google 翻訳はひっそりと翻訳コアをアップグレードしました。 Google が提供する公式データによると、Google 翻訳で使用されている Google ニューラル マシン トランスレーション (GNMT) システムは、現在利用可能な最も高度なトレーニング テクノロジを使用しており、これにより機械翻訳のレベルが向上し、翻訳エラーがさらに 55%~85% 削減されます。 Googleの翻訳モデルの品質 10 年以上前、Google は Google 翻訳をリリースしました。初期の頃は、フレーズベースの統計的機械翻訳によって、入力された文章が単語やフレーズに分解され、個別に翻訳されていました。この翻訳方法の欠点は非常に明白です。文中の元々完全な情報が断片化され、首尾一貫して表現できないのです。この現象は、英語と中国語間の翻訳において特に顕著です。 一方、Google ニューラル機械翻訳は、入力された文全体を翻訳します。 中国語から英語への翻訳を例にとると、Google ニューラル機械翻訳はまずこの中国語の文章内の単語をベクトルのリストにエンコードします。各ベクトルは、これまでに読み取られたすべての単語の意味を表します (エンコーダー)。文章全体を読み終えると、デコーダーが動作を開始し、英語の文章を 1 単語ずつ生成します (デコーダー)。 上図はGoogleニューラル機械翻訳の中国語-英語翻訳原理を示している。 各ステップで正しい翻訳された単語を生成するために、デコーダーは、生成された英語の単語に最も関連性の高い中国語ベクトルの重み分布に焦点を当てます。 最初に提案されたとき、ニューラル機械翻訳システムは、中規模のデータセットではフレーズベースの翻訳システムに匹敵するものでした。 Google は現在、ニューラル機械翻訳によって非常に大規模なデータセットを扱う際の多くの課題を克服し、より高速かつより正確に翻訳できるシステムを構築したと発表している。 現在、中国語から英語への翻訳にはGoogleのニューラル機械翻訳システムが利用されています。 Google 翻訳は現在、モバイルとウェブ上での中国語から英語への翻訳にニューラル機械翻訳を使用しており、1 日あたり約 1,800 万件の翻訳が行われています。 大規模なデータセットでテストされた Google のニューラル機械翻訳システムを搭載した最新の Google 翻訳は、どれほど効果的なのでしょうか? 簡単な比較テストを行いました。もちろん、これはまだ中国語から英語への翻訳のシナリオです。 テストシナリオ: PC側Google翻訳ウェブバージョン 英語のメッセージがランダムに選択され、元のテキストは次のとおりです。 COVID-19 が始まって以来、小売業やブランド製造業のパートナーからは、消費者の需要の変動を踏まえ、消費者の関心がどのように変化しているかについて、より詳しい情報を求めているという声が寄せられています。こうした変化は、Google での検索方法に反映されています。先月は、人々が自宅で過ごす時間が増えたため、家庭用品やジグソーパズルの検索関心が急増しました。今月は、米国ではミシンやベーキング用品、英国とオーストラリアではテザーボール セットやチョークへの関心が急増しました。 企業は、Google トレンド、ソーシャル リスニング、アンケート、自社データなど、さまざまなリソースを活用して消費者の関心の変化を把握し、即座に意思決定を行っています。しかし、何を探せばよいかがわからなければ、どの製品カテゴリが人気を集めているのか、またそれがチャンスとなる可能性があるのかを簡単には理解できません。 そのため、Think with Google で急成長中の小売カテゴリ ツールをリリースします。このツールは、Google 検索で急成長している商品関連カテゴリ、そのカテゴリが成長している場所、関連する検索語句を表示します。人々が検索している商品カテゴリに関するこのような分析情報を提供するのは今回が初めてです。 Google 翻訳の旧バージョンによる英語 - 中国語の翻訳結果: アップグレード後の Google 翻訳による新しい英語 - 中国語翻訳結果。赤でマークされた部分は、以前の翻訳結果と異なります。新しい翻訳は次のとおりです。 2つの翻訳結果を比較すると、大きな違いがあることがわかります。全体的に、新しい翻訳結果で赤でマークされた表現は、明らかに中国語の文法や表現習慣に沿っています。 さらに、最後の段落の翻訳結果の最適化がより顕著になり、Google の製品名「Think with Google」が正確に識別され、ランダム翻訳の恥ずかしさが回避されました。 確かに賢いですね! |
<<: プロセス産業におけるグリーン製造における人工知能の機会と課題
>>: IoT、AI、ブロックチェーンがビジネス経済を変革する
この投稿では、最近の TCN ベースのソリューションをいくつかレビューします。まず、動き検出のケース...
論文:混合モデルアプローチによる電子商取引プッシュ通知での補完製品の推奨論文リンク: https:/...
[[316164]]天才イーロン・マスクについて語るとき、多くの人はまずテスラを思い浮かべるでしょう...
編集者注: この記事は、WeChat パブリック アカウント「Big Data Digest」(ID...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
デジタル変革の結果、テクノロジーは長年にわたってどのように変化してきましたか?アクセンチュアが第 2...
人工知能は日々進歩しており、大規模な言語モデルはますます強力になっています。仕事に役立つ AI ツー...
1月22日午後、上海地下鉄15号線で重大事故が発生した。千安路駅のプラットホームで、乗客が電車から...
1月24日のニュースでは、大規模言語モデル(LLM)の開発にはコストがかかることがよく知られていま...
6月16日のニュース: 人工知能技術の急速な進歩に伴い、その潜在的な危険性についての議論がますます白...
テスラは2020年10月、車の所有者が駐車し、巡航速度で車線を自動的に維持し、赤信号で停止することを...
[[222688]]未来学者のケビン・ケリーはかつてこう言った。「人工知能は今後20年間で人類社会を...
今日、人工知能技術は、ウェアラブルデバイス、自動車、生産性アプリケーション、軍事、ヘルスケア、ホーム...