ディスカッション | 人工知能は同時通訳に取って代わることができるか?

ディスカッション | 人工知能は同時通訳に取って代わることができるか?

[[254687]]

少し前に同時通訳者がiFlytekを「AI同時通訳詐欺」と非難し、ネット上で騒動となった。人工知能と同時通訳が話題になっています。今日は、「人工知能翻訳は本当に同時通訳に取って代わることができるのか?」についてお話しします。

同時通訳はどれくらい難しいですか?

同時通訳は、第一次世界大戦後のパリ講和会議で初めて登場しました。イギリスとフランスの代表は、同時通訳の助けを借りて激しい交渉を終えました。

今日でも、この技術は国際会議において極めて重要な役割を果たしています。統計によると、国際会議の95%はプロの同時通訳者の支援を受けています。

同時通訳者が舞台で同時通訳のスキルを自由に発揮できるようになるには、日常生活で多くの練習を積む必要があります。両方の言語に堪能なプロであっても、実際に使えるようになるまでには数年の訓練を受ける必要があります。会議の資料を事前に勉強して理解する必要があるだけでなく、変化する状況に適応する能力も必要です。同時通訳の作業方法も非常に特殊です。大きなプレッシャーがかかるため、通常は複数の人が協力して作業します。数時間にわたるプロセスの中で、各人が交代で数十分間通訳します。

それに比べると、通常の通訳業務ははるかに簡単です。機械翻訳が同時通訳に取って代わることができれば、間違いなく大きな価値を持つでしょう。

AI翻訳はどれくらい優れているのでしょうか?

では、AI同時通訳の能力とは何でしょうか?同時通訳者の仕事を奪ってしまうのでしょうか?

今年上半期のボアオ・アジアフォーラムでは、AI同時通訳が初めて登場した。しかし、現場に設置されたシステムに不具合が生じ、語彙の不正確な翻訳や重複などの軽微なエラーが発生していました。

客観的に言えば、人工知能や機械翻訳技術は、自然言語処理において確かに多くの進歩を遂げてきました。こうした画期的な技術は人々に希望を与え、未来を想像することを可能にします。しかし、短期的な価値は、翻訳支援などの分野に反映されています。

もちろん、機械翻訳は大きな進歩を遂げています。食べ物、衣服、住居、交通など、日常よく使われる表現の中英翻訳は大学6年生レベルに達し、いくつかの場面で人々の言語コミュニケーションの問題に対処するのに役立ちます。しかし、人間の同時通訳や高度な翻訳に求められる「忠実性、表現力、優雅さ」との間には、まだ大きなギャップがあります。

現在のギャップは、既存の技術レベルの限界によって決まります。機械翻訳は自動翻訳とも呼ばれ、コンピューターを使用して 1 つの言語を別の言語に変換することです。機械翻訳技術の発展は、コンピューター技術、情報理論、言語学、その他の分野の発展と密接に関連しています。初期の辞書マッチングから、言語専門家によってまとめられた知識ルール、コーパスベースの統計的手法まで、計算能力の向上と多言語情報の蓄積により、機械翻訳技術はいくつかのシナリオで便利な翻訳サービスを提供し始めています。

新世紀以降、インターネットの普及に伴い、インターネット企業は機械翻訳研究グループを設立し、インターネットビッグデータに基づく機械翻訳システムを開発し、機械翻訳が真に実用的なものとなり、比較的成熟した自動翻訳製品が市場に登場し始めました。近年、ディープラーニングの進歩により、機械翻訳技術がさらに発展し、翻訳品質の向上が促進され、翻訳がより本物らしく流暢なものになりました。

機械翻訳の難しさは何ですか?

ここでは、機械翻訳の難しさについて簡単に紹介します。機械翻訳プロセス全体は、音声認識変換、自然言語分析、翻訳変換、翻訳生成などの段階に分けられます。ここでは、比較的典型的なルールベースの機械同時翻訳を例にとると(下図参照)、モジュールには、音声認識(音声をテキストに変換)、自然言語処理(構文解析、意味解析)、翻訳変換、翻訳生成、音声生成の各モジュールが含まれます。主な技術的な困難としては、音声認識、自然言語処理、翻訳変換などがあります。

最初の技術的な難しさは音声認識です。過去20年間で音声認識技術は大きな進歩を遂げ、家電、自動車、医療、ホームサービスなどさまざまな分野に進出し始めました。一般的なアプリケーション システムには次のものがあります。

キーボード入力方法と比較して、音声入力システムは人々の日常の習慣に沿っており、より自然で効率的です。

音声制御システム、つまり音声を使用して機器の操作を制御するシステムは、手動制御よりも高速で便利であり、産業制御、音声ダイヤルシステム、スマート家電、音声制御スマート玩具など、多くの分野で使用できます。

インテリジェントな対話クエリシステムは、顧客の声に応じて動作し、ホームサービス、旅行代理店サービスシステム、チケット予約システム、銀行サービスなどの自然でフレンドリーなデータベース検索サービスをユーザーに提供します。

音声認識技術を他の自然言語処理技術と組み合わせることで、多くの複雑なアプリケーションを構築できると言えます。

しかし、音声認識の主な難しさは、自然言語の認識と理解です。まず、連続した音声を単語や音素などの単位に分解し、次に意味を理解するための規則を確立する必要があります。音声情報量が多いため、発話パターンは話者ごとに異なるだけでなく、同じ話者でもシナリオによって異なります。

たとえば、人が気軽に話しているときと真剣に話しているときでは、声の特徴が異なります。さらに、話者が話しているときに、異なる単語が同じように聞こえることはよくあります。単一の文字、単語、または記号の音声特性は文脈によって影響を受け、その結果、強勢、ピッチ、音量、発音速度が変化します。最後に、環境ノイズや干渉も音声認識に大きな影響を与え、認識率が低下します。

2 番目の技術的な難しさは、インテリジェント機械翻訳システムの中核部分である意味解析です。現在、機械翻訳システムは、ルールベースとコーパスベースの 2 つのカテゴリに分けられます。前者は辞書と言語知識ルールベースに基づいており、後者は主に統計アルゴリズムに基づいて分割され注釈が付けられたコーパスの知識ソースで構成されています。

機械翻訳システムはコーパス言語学の発展とともに発展しました。現在、世界中の機械翻訳システムの大部分はルールベースの戦略を採用しており、一般的に文法型、意味型、知識ベース型、インテリジェント型に分類されます。さまざまなタイプの機械翻訳システムは、さまざまなコンポーネントで構成されています。抽象的に言えば、すべての機械翻訳システムの処理には、ソース言語の分析または理解、言語の文法、意味、および語用論の側面での変換、およびターゲット言語の構造規則に従ったターゲット言語の生成という次のステップが含まれます。

現在、Google のオンライン翻訳はすでによく知られています。その第一世代の技術は、統計に基づく機械翻訳方法です。基本原理は、大量のバイリンガル Web ページをコーパスとして収集し、コンピューターが単語間の最も一般的な対応関係を自動的に選択して、最終的に翻訳結果を返すことです。

しかし、この技術を使用しても満足のいく結果は得られず、さまざまな翻訳ジョークにつながることがよくあります。なぜなら、統計ベースの方法では大規模なバイリンガルコーパスの構築が必要であり、翻訳モデルと言語モデルパラメータの精度はコーパスのサイズと品質に直接依存するからです。翻訳の品質はモデルの品質とコーパスのカバレッジに直接依存します。

上記の従来の方法に加えて、2013 年以降、ディープラーニング研究が大きく進歩したことにより、人工ニューラル ネットワークに基づく機械翻訳が徐々に登場してきました。現在、機械翻訳では長短期記憶リカレントニューラルネットワークが広く使用されています。このモデルは自然言語のモデリングに優れており、任意の長さの文を特定の次元の浮動小数点ベクトルに変換しながら、文中のより重要な単語を「記憶」し、より長いセッション時間にわたって「記憶」を保持できるようにします。このモデルは、自然言語文のベクトル化の問題をうまく解決します。

その技術的な中核は、多層ニューラル ネットワークを通じてコーパスから知識を自動的に学習することです。ある言語の文がベクトル化された後、ネットワーク内の層ごとに渡され、複数の層にわたる複雑な伝導操作を経て、翻訳が生成されます。この翻訳方法の最大の利点は、翻訳が流暢で文法規範に忠実であることです。従来の翻訳技術に比べ、品質が大幅に向上しました。

インテリジェントな同時翻訳はどのくらい遠いのでしょうか?

多くの人が機械翻訳について誤解しており、機械翻訳には大きな偏差があると考えていることに注意する必要があります。実際、機械翻訳は言語知識を使用して、文法を自動的に識別し、意味理解をシミュレートし、対応する翻訳を実行します。文法、意味、語用論の複雑さにより、エラーは避けられません。これまでの結果から判断すると、あらゆるシナリオで使用できる機械翻訳の翻訳品質は、まだ最終目標からは程遠いと言えます。

グローバル化したインターネット時代の到来により、言語の壁は21世紀の社会発展にとって重要なボトルネックとなっています。いつでも、どこでも、どんな言語でもバリアフリーなコミュニケーションを実現することは、人類が追い求める夢です。これは、世界全体の状況のほんの小さな縮図にすぎません。急速な社会発展の過程において、機械翻訳はますます重要な役割を果たすでしょう。

<<:  世界銀行:ロボットはまだ私たちの仕事を奪ってはいない

>>:  プライベートUNIT学習ノート - 対話システムの構築を簡単に始めることができます

ブログ    
ブログ    

推薦する

...

制御可能な人工知能には未来がある

8月29日、2019年世界人工知能会議が上海で開幕した。世界各国の著名なテクノロジー企業や学界、産業...

2018 年までに世界を変える 9 つのテクノロジーをご紹介します。

編集者注: 有名なベストセラー作家のバーナード・マー氏は最近、「2018 年に私たちの世界を定義する...

研究者たちは、スマートデバイスがAIを使って声の発信元を判断できるようにする準備を進めている。

このアイデアはプライバシー擁護者を怖がらせているが、スマートスピーカーの開発者は、ユーザーのウェイク...

ソニー、AI製品の倫理審査を実施へ

日経新聞によると、ソニーは早ければ2021年春にも、倫理的リスクのスクリーニングに人工知能を活用した...

...

人工知能向け開発言語5つを比較するとどれが優れているのか?

我が国の人工知能は近年急速に発展しており、顔認識や医療など多くの分野で優れた成果を上げています。しか...

AIが建物の快適性に革命を起こす

商業ビルでは、顧客と居住者の快適性がポジティブな体験を保証するために重要です。快適さの重要な要素は、...

需要は拡大し続けており、配達ロボットには克服すべきいくつかの大きな技術的課題がある

特別なイベントの影響を受けて、非接触型の配達や食事が需要のトレンドになっています。その結果、業界にお...

人工知能を活用するための5つのベストプラクティス

生産性、精度、意思決定能力を向上させるために人工知能 (AI) を導入する手法は、さまざまな業界で広...

...

...

人間の姿勢評価技術の開発と実装

[51CTO.com クイック翻訳]関連調査レポートによると、デジタルフィットネス市場の規模は202...

話題の「人工知能」について、気になるNの質問にお答えします

人工知能は、かなり長い間人気を博してきました。多くの投資家、起業家、そしてあらゆる規模の企業が、この...

人工知能はますますあらゆる分野に浸透しつつある

近年、人工知能技術は急速に発展し、ますます多くの分野でその急速な発展の勢いと大きな可能性を発揮してい...