人工知能翻訳は、障害なく外国人と恋に落ちるのに役立ちます

人工知能翻訳は、障害なく外国人と恋に落ちるのに役立ちます

AI 音声翻訳の分野では、ノイズは対処しなければならない主要な課題の 1 つです。この装置は研究室や会議室での会話を認識できるかもしれないが、日本の京都駅で私(マレク・コーン)が話したワイベル教授の周囲では、背景の雑音がまだ聞こえた。私は英語で彼の考えを追おうとしましたが、走り書きされた文章を見て、私たちが1万キロ近く離れていることを思い出しました。同じ言語を話していたとしても、距離がコミュニケーションの大きな障壁となっていました。

[[257914]]
同時通訳者の仕事

結局のところ、私たちはSFで描かれるようなシームレスなコミュニケーションをまだ実現していないのです。これらの説明では、ワイベル教授は母国語であるドイツ語で説明できましたが、私は英語を聞きました。おそらく、たとえ周りの日本人全員が母国語を話していたとしても、ハンズフリーでシームレスに会話できるだろう。

ドイツのカールスルーエ工科大学のコンピューターサイエンス教授であるワイベル氏と彼の同僚は、学生が電子翻訳機を使って英語で講義を聞く一方で、ドイツ語で授業を行うことができた。このシステムは、生徒がノートパソコンや携帯電話で読めるテキストを生成するので、そのプロセスは字幕作成に多少似ています。しかし、これにより、講師は背景の違いを気にすることなく、より明確にコースを紹介できるようになります。

AI音声翻訳のアイデアは以前から存在していました。

ワイベル氏は、米国カーネギーメロン大学のコンピューターサイエンスの教授でもあり、人工音声翻訳の生みの親とも言える人物です。彼は1978年にマサチューセッツ工科大学(MIT)でこのアイデアを思いついた。ダグラス・アダムスも同じ頃にこのアイデアを思いついた。

『銀河ヒッチハイク・ガイド』には、バベルフィッシュと呼ばれる生命体が登場します。このバベルフィッシュを耳に入れると、宇宙のあらゆる生物の言語を理解できるようになります。これは、携帯型音声通信デバイスや壁に取り付け可能な薄型テレビなど、技術愛好家が長年望んできたデバイスを表しており、ずっと以前から存在すべきであり、いつか現実のものとなるであろうものです。

1991 年、ワイベル氏は最初の音声翻訳システムを構築しました。このシステムは 500 語の語彙を持ち、大型ワークステーションで実行でき、聞いた内容を処理するのに数分しかかかりませんでした。 「音声翻訳の黄金時代にはまだ間に合っていなかった」と彼は認める。今日、人間による翻訳と音声認識技術が進歩し続けるにつれ、バベルフィッシュに似たプロトタイプのデバイスが登場し始めている。

Google は、Google Translate を使用して Pixel イヤホンに翻訳機能を組み込みました。Google Translate では、スマートフォン アプリを通じて音声翻訳も行えます。 Skype には 10 の言語に対応できる翻訳機能があります。ニューヨークのブルックリンに拠点を置く新興企業、ウェイバリー・ラボなどの小規模な企業も、イヤホン翻訳機を開発している。技術系メディアのレビューは、「実は悪くない」とまとめるのが妥当でしょう。

現在利用可能なシステムはこの概念を実証しているが、現段階では、それらはワイベル氏が言うところの「言語的に透明な社会の構築」に向けたステップというよりも、魅力的な新製品として見られているようだ。人工音声翻訳の開発を推進する大きな傾向は、人々がコミュニケーションにこの技術を利用することを奨励することです。 「音声デバイスのパラダイムは、概してまだ初期段階にあるが、急速に進化しており、翻訳はその道のりの重要な部分の一つとなるだろう」と、Google Translateのプロダクトディレクター、バラク・トゥロフスキー氏は語った。

先月、GoogleはHomeデバイス向けに通訳モードを導入した。これは、「Hey Google、フランス語の翻訳者になって」と話しかけることで、スマートディスプレイ上で音声とテキストの翻訳を可能にするものだ。 Google は、ホテルのチェックインをユースケースとして提案しています。これはおそらく、英語を母国語または別の言語として話す人々が使用する「旅行者の英語」として機能する言語の明らかな例です。

携帯電話に翻訳アプリがインストールされていれば、画面やスピーカーが小さくても、すでにこれが可能です。このシンプルな共同のやりとりは、アプリの会話機能を最大限に活用します。しかし、もうひとつの人気のユースケースは、Turovsky 氏が「ロマンス」と呼ぶものです。データログから、「愛しています」や「あなたの目はきれいですね」といったフレーズが人気があることが明らかになりました。これらの多くは、何も新しいことを表していないかもしれません。結局のところ、口説き文句は何十年もの間、標準的な会話集の一部となってきました。

Waverly Labs はチャット機能を使用して Indiegogo キャンペーンを宣伝しました。同社の創設者兼CEOのアンドリュー・オチョア氏は、動画の中で自身のインスピレーションについて語った。休暇中にフランス人女性に出会ったが、彼女とうまくコミュニケーションが取れなかったため、翻訳者になるというアイデアを思いついたという。翻訳アプリを使おうとすると「ひどい経験」になった。携帯電話は邪魔になりますが、ヘッドフォンは顔の邪魔になりません。このビデオでは、何が起こるかを示しています。彼はフランス人女性にヘッドフォンを見せ、その後、コーヒーを飲みながら観光に出かけます。デモは大成功し、オチョア氏は当初の目標額の30倍となる440万ドルを調達した。


Waverly Labs の Pilot イヤホン (赤と白) と Google の Pixel イヤホン (黒)

ある顧客は、Waverly Labs Pilot ヘッドセットのおかげで、ガールフレンドの母親と初めて話すことができたと語った。配偶者と会話できるようになるという人もいます。オチョア氏は次のように述べている。「時々、スペイン語を話す妻と話すのにこのデバイスを使っているというメールが届きます。そもそもどうやって知り合ったのか、まったくわかりません!」インターネットと結婚仲介業者を通じて出会って恋に落ちたのではないかと推測できる。オチョア氏は、ヘッドフォンを通じて愛を見つけるには技術がまだ進歩する必要があると認めたが、それはそれほど遠い未来のことではない。

多くの早期導入者は、パイロット ヘッドセットを、明らかにロマンチックではない用途に使用し、組織内で運用しました。 Waverly Labs は現在、音声認識、翻訳の精度、翻訳テキストの配信時間のパフォーマンスの向上が求められる専門的なユースケース向けの新しいモデルを開発しています。 「職場のプロフェッショナルは会話において忍耐力に欠ける傾向がある」とオチョア氏は言う。

新バージョンでは、パイロット ヘッドセットの最も魅力のない側面を克服するために、衛生的なデザインも改良されています。通話時には、双方がパイロットヘッドフォンを着用する必要があります。 「見知らぬ人とヘッドフォンを共有することには障壁があることがわかった」とオチョア氏は言う。これは驚くことではないかもしれない。ヘッドフォン翻訳が一般的になり、見知らぬ人がすでに自分のヘッドフォンを耳につけているようになると、この問題は解決されるでしょう。それが実現するかどうか、またどれほど早く実現するかは、イヤホン自体よりも、音声制御デバイスや人間の翻訳者がどれだけ普及するかにかかっているかもしれない。

この点では、アジアの新興市場への参入が主な原動力となっているようです。 Google は、インターネット上のコンテンツの 50% が英語であると推定していますが、英語を話すのは世界の人口の 20% にすぎません。 「アジア諸国のようにインターネットの利用が急速に伸びている場所を見ると、ほとんどの人が英語をまったく理解していない」とトゥロフスキー氏は言う。「だから言語の壁を打破することは誰にとっても重要な目標であり、もちろんグーグルにとってもそうだ。だからこそグーグルは翻訳システムにこれほど多くのリソースを投入しているのだ」

ワイベル氏はまた、音声翻訳が日本と中国で本格的に普及しつつあることを指摘し、アジアの重要性を強調した。しかし、まだ道のりは長いです。テレビの同時通訳者が、話者が数文ごとに一時停止して通訳者の応答を待つのではなく、外国の政治家が話すときにそのペースに合わせる必要があるのと同じように、翻訳も同期させる必要があります。インターネットにアクセスできない場合でもオフラインで動作でき、処理のためにサーバーに送信されてクラウドに蓄積されるプライベートな音声データの量に関する懸念に対処できる必要があります。

ワイベル氏は、システムは騒音などの物理的な課題に対処するだけでなく、人々の行動を理解し、適切に話しかけるといった社会的認識も必要になると示唆している。私が最初にワイベル教授に電子メールを送ったとき、彼がドイツ人教授であり、大陸ヨーロッパの伝統では学術的地位に真摯な敬意が求められることを認識していたため、私は彼を「親愛なるワイベル教授」と呼びかけるという偏見のある間違いを犯しました。

予想通り、彼は国際標準英語で「こんにちは、マリク」と返答しました。エチケットに敏感な人間の翻訳者は、人々が異なる文化規範を理解する必要性を排除し、誤解を減らしながらコミュニケーションを促進します。同時に、地元の慣習を保存し、国際的な英語に関連する習慣の広がりを遅らせるのに役立つ可能性があります。

しかし、教授やその他の人々は言語認識をソフトウェアにアウトソーシングすることはありません。この技術が、バベルフィッシュのようにシームレスかつ遍在するレベルまで成熟すれば、言語スキルの価値は実際に高まることになるでしょう。自動翻訳は、人々が物を購入したり目的地を見つけたりする際に役立つ基本的かつ実用的な情報という商品を提供します。それが人々の家庭生活や恋愛関係の管理に役立つかどうかは未解決の問題です。しかし、これは、移民後に世代間でしばしば生じる言語の壁を克服し、祖父母と共通の言語を持たない子供たちを残す可能性があるという注目すべき可能性である。

しかし、AI音声翻訳技術をどのように使用しても、本物のバベルフィッシュほど優れた翻訳にはなりません。音声モーフィング技術は話者の声をシミュレートできますが、唇の動きが一致せず、吹き替え映画のように見えます。この対比により、共通言語の価値と、それを学ぶことの価値が強調されます。

他の人の言語を学ぶ努力をすることは、献身の表れであり、信頼性の表れと見なされます。言語を共有することで帰属意識や共同体意識も育まれる。例えば、先人たちがラテン語を使用していたのに対し、今では英語を共通語として使用している国際的な科学者がいる。移民の店主が顧客の言語を学ぶことは、販売を容易にするだけでなく、顧客のコミュニティに近づきたいという願望を示し、丁寧にその一員であると主張することにもなります。

機械翻訳が普及すると、人間の言語スキルが評価されるようになります。数字に強い人が電卓を使う必要がある人よりも有利であるのと同じように、多言語を話せる人はデバイスに依存する人よりも常に有利です。共通言語の実際の必要性は減少するだろうが、そのような言語を共有することの社会的価値は存続するだろう。ソフトウェアは、言語の知識から得られる微妙で重要な理解体験に取って代わることは決してありません。結局のところ、混沌の中のニュアンスを見つけるには、この知識が常に必要なのです。

<<:  ベセット氏との対話:自動運転車が人間の信頼を勝ち取るのはいつでしょうか?

>>:  マイクロソフト中国CTO: AIを祭壇から外してください

ブログ    
ブログ    
ブログ    

推薦する

火山エンジンは大型モデル用の大きなベースを作ります! MiniMax、Zhipu AIなどが上陸

Volcano Engine は、大規模モデルのトレンドに関する解答用紙を提出しました。大型モデルサ...

...

小さなモデル、大きなトレンド! Googleは2つのモデルを提案した。音量は7倍に減少し、速度は10倍に増加する。

[[426899]]ニューラル ネットワーク モデルとトレーニング データのサイズが大きくなるにつ...

生成 AI、その開発は持続可能か?

シャム・ナンダン・ウパディヤイノアが編集制作:51CTO テクノロジースタック(WeChat ID:...

アルパカたちはどこまで来たのでしょうか?研究によると、最高のものはGPT-4のパフォーマンスの68%を達成できる。

大規模言語モデルは最近、かつてないほどの注目を集めています。急速に変化する環境において、オープンソー...

絶賛されていたGPT-3が充電開始します!ネットユーザー:値段が高す​​ぎる。もう行っちゃった。

少し前に絶賛されたGPT-3を覚えていますか?招待されたユーザーのみがテスト・使用できるもので、史上...

...

CNNを知っておくべきだ

CNN というと、最初は特定のテレビ局を思い浮かべる人が多かったのですが、数年後にはディープラーニン...

...

BEV の可能性の限界を探ろう! DA-BEV: 新しい教師なし BEV SOTA ソリューション!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

Huice: 大手 e コマース企業が使用しているスマート小売管理ソフトウェアの優れた点は何でしょうか?

6月30日、北京地下鉄の改札口でデジタル人民元が支払いに使えるようになる。「孔坊兄弟」は再び変身し...

AI+サイエンス: PaddlePaddle をベースにした AlphaFold2 でタンパク質構造予測を実現

1958 年、FHC クリックは、生物学における重要なセントラルドグマである DNA -> R...

アルゴリズムのパフォーマンスを最適化するためにデータ品質を確保するための 6 つのヒント

今日、企業は、分析アルゴリズムの良し悪しは、そのアルゴリズムをトレーニングするデータの良し悪しによっ...

メタバースと自動運転車のどちらが先に来るでしょうか?

今年、未来のテクノロジーの中で最も注目されている2つの分野は、メタバースと自動運転車です。メタバース...