機械翻訳:人工知能分野の重要な中核技術

機械翻訳:人工知能分野の重要な中核技術

近年、機械翻訳 (MT) は大きな進歩を遂げ、満足のいく成果を達成しました。 MT は人工知能分野の重要な中核技術として、専門家から幅広い注目と研究を集めています。しかし、現状ではMTは翻訳全体の品質が低い、翻訳後の修正作業量が大きいなどの問題があり、これらの問題を解決する必要があります。

[[431814]]

MT 技術の発展は、コンピュータ サイエンス、言語学、心理学、サイバネティクス、情報理論などの分野の発展と密接に連動して進んできました。初期の辞書マッチングから、辞書と言語専門家の知識を組み合わせたルールベースの翻訳、コーパスベースの統計翻訳まで、コンピューターの計算能力の向上と多言語情報の爆発的な増加により、MT 技術は徐々に象牙の塔から抜け出し、一般ユーザーにリアルタイムで便利な翻訳サービスを提供し始めました。

現在主流の MT 技術はニューラル ネットワーク翻訳 (NMT) であり、これは近年になって提案されたばかりの翻訳方法です。従来の翻訳方法と比較して、NMT は、あるシーケンスから別のシーケンスにマッピングできるニューラル ネットワークをトレーニングし、出力を可変長のシーケンスにすることができるため、翻訳のパフォーマンスが向上します。 NMT技術は現在の研究の鍵かつホットスポットとなっていると言えます。

現在、市場で比較的成熟した MT テクノロジは Google 翻訳と Microsoft 翻訳です。これらのテクノロジの背後にあるのは、統計に基づく翻訳方法です。基本的な動作原理は、大量のバイリンガル Web コンテンツをコーパスとして検索し、コンピューターが単語間の最も一般的な対応関係を自動的に選択して、最終的に翻訳結果を返すことです。現在、Google と Microsoft はニューラル ネットワークとディープラーニングの原理とフレームワークを採用しており、MT 技術は大幅に向上しています。

ただし、どの翻訳方法を使用する場合でも、MT の開発に影響を与える最大の要因は翻訳の品質です。 MT のこれまでの成果から判断すると、翻訳の品質は理想的な目標 (上級翻訳者の翻訳レベルに到達すること) にはまだほど遠いと言えます。周知のように、手動翻訳(略して「人力翻訳」)のプロセスは、手動翻訳者による理解、分析、選択、再作成を統合した総合的な操作であり、脳の体系的な思考活動のプロセスです。

MT の翻訳品質を人間の翻訳レベルにまで引き上げるには、脳が言語情報を処理する仕組みの謎を解明する必要があります。実際、中国の科学者で未来学者の周海中教授は、1990年代初頭にはすでに、脳が言語のあいまいな認識と論理的判断をどのように行うかを人間がまだ理解していない限り、MTが「忠実性、表現力、優雅さ」のレベルを達成することは不可能だろうと指摘していた。彼の予測は今日基本的に実現しており、MT の将来の発展において現実のものとなる可能性が高い。

近年実施されている欧州脳プロジェクト、米国脳プロジェクト、中国脳プロジェクト、日本脳プロジェクトなどは、いずれもコンピュータを使用して人間の脳をシミュレートすることを目的としており、その中核となる内容はニューロインフォマティクスです。この新たな最先端分野の研究結果は、脳が自然言語を処理する仕組みを理解するのに役立ち、人工知能、特に MT 技術の分野における進歩への道を開くものと期待されています。

MT が人間の翻訳レベルに到達するまでには、まだ長く困難な道のりがあります。この人工知能分野の重要なコア技術を解決するには、将来の科学技術の発展、特に脳科学における大きな進歩が必要です。現時点では、機械翻訳と人間による翻訳を組み合わせて相互に補完することしかできません。これにより、翻訳の時間とコストを節約できるだけでなく、高品質の翻訳も作成できます。

<<:  毎日のアルゴリズム: 回転マトリックス

>>:  AIは依然として人気、テクノロジー企業の人材育成の道筋を見てみよう

ブログ    

推薦する

アルトマンがOpenAIに復帰、イリヤはどこへ行くのか、内部抗争の理由は信じられない

OpenAI シリーズは終わりに近づいていますが、イースターエッグがあるとは思っていませんでした。ま...

敵対的 AI とは何ですか?なぜそれが重要なのでしょうか?

[[250514]] [51CTO.com クイック翻訳] 人工知能 (AI) は、政府、企業、国...

中山大学、AIGCの大規模応用を促進するためにソース拡散モデル統合コードフレームワークを公開

近年、拡散モデルに基づく画像生成モデルが次々と登場し、驚くべき生成効果を示しています。しかし、関連す...

持続可能な都市計画とスマートシティに人工知能を活用する方法

21 世紀の急速な都市化は、交通渋滞や汚染から住宅不足や公共サービスの逼迫まで、数多くの課題をもたら...

2021年になっても、データにラベルを付ける方法がまだわかりませんか?なぜ人工知能にはデータ注釈が必要なのでしょうか?

「データを持っている者は人工知能を持っている。」現在、人工知能は私たちの生活の中で当たり前のものに...

今後 5 年間で最も収益性の高い業界は何ですか?人工知能を勝ち取る者はインターネットを勝ち取るのでしょうか?

[[221537]]今後 5 年間で最も価値のある起業の方向性は何でしょうか?どの起業分野を選択す...

Facebookの詐欺行為と戦う方法を学び、CopyCatchアルゴリズムがLockstepをどのように解決するかを見てみましょう

[51CTO.com クイック翻訳] インターネットが誕生して以来、あらゆる種類のジャンク情報や悪意...

...

人工知能技術はスマートシティの未来となるのでしょうか?

人工知能技術の急速な発展は、私たちの日常生活のあらゆる側面に変革的な影響を及ぼしています。 最も注目...

2020年のライフスタイルに関する2008年の予測:そのほとんどが実現

米国のピュー・リサーチ・センターは2008年に、主に以下のような2020年のライフスタイルを予測しま...

RPAが企業にもたらすメリットトップ10

この記事では、RPA がビジネスの効率と生産性を向上させる 10 の方法について詳しく説明します。 ...

...

数百万人の乗客を「迅速に配達」する人工知能の応用

ほとんどの人がテイクアウトを注文しており、今ではテイクアウトは中国人にとってもう一つの食事方法となっ...

2020 年に人気の機械学習プロジェクト トップ 10

2021 年が始まりました。過去 1 年間で機械学習コミュニティでは多くの出来事がありました。時間...

ディープニューラルネットワークをデバッグするにはどのような方法を使用しますか? 4つの簡単な方法をご紹介します

データセットの構築、ニューラル ネットワークのコーディング、モデルのトレーニングに何週間も費やした後...