聖書の旧約聖書創世記には、人類が団結して天国に通じるバベルの塔を建てたという話があります。この計画を阻止するために、神は人間に異なる言語を話させ、人間同士がスムーズに意思疎通できないようにしました。その結果、計画は失敗し、人々は散り散りになりました。これは、人類の発展の歴史におけるコミュニケーションの重要性を一面から示しています。ハンサムなブラッド・ピット主演の映画「バベル」を見たことがある人なら、言語、次元、文化の異なる人々の間でのコミュニケーションの難しさも感じられるでしょう。 モバイルインターネットに続いて人工知能が新たな話題となるにつれ、この魔法のツールは機械翻訳、人工アシスタントの自然言語処理など、さまざまな分野で応用されています。人工知能は、長年の人と人とのコミュニケーションの束縛を打ち破り、人と人との円滑なコミュニケーションを実現できるのでしょうか? 人工知能、翻訳は行き場を失うのか?
言語は人間にとって最も重要なコミュニケーションツールです。しかし、人間の言語の多様性と複雑さを考えると、異なる言語は世界や互いの理解の障害にもなります。人々は異なる国の製品紹介を理解できるでしょうか?世界中の主要な株式市場の取引情報や関連ニュースをスムーズに理解できるでしょうか?異なる言語による障壁を打ち破り、地域を超えた対人コミュニケーションをスムーズに行うことは、人類の美しい夢でした。 現在、科学技術の発展により、機械翻訳技術は大きな進歩を遂げています。機械翻訳における人工知能の応用は誰の目にも明らかです。 Googleは最近、米国、ヨーロッパ、アジアのGoogle翻訳システムが正式にAI駆動型にアップグレードされ、英語、スペイン語、フランス語、ポルトガル語、ドイツ語、中国語、日本語、韓国語、トルコ語を含む複数の言語をサポートすると発表しました。 Google のオンライン人工知能システムは、強力な翻訳処理機能を発揮します。 Googleは、「以前のアルゴリズムと比較して、Googleニューラル機械翻訳システム(GNMT)は翻訳エラー率を80%削減でき、人間の翻訳者の翻訳レベルに非常に近い」と述べた。 リアルタイム音声に関しては、Microsoft の技術開発はさらに進んでいます。マイクロソフトの子会社であるSkypeのSkype Translator翻訳機能は、基本的に異なる言語間のリアルタイムの音声翻訳をスムーズに実現できます。 100年以上前、中国の翻訳業界の先駆者である顔復は、翻訳作業における「忠実、優雅、表現力」の3つの原則を提唱しました。しかし、この規格が何年も後に機械の測定に使用されるようになるとは、彼は想像もしていなかったでしょう。過去2年間のニューラルネットワーク機械翻訳技術の出現により、ヤン氏の「信念」の真の意味が実現されたことは否定できない。 東京大学のヒューマン・コンピュータ・インタラクションの著名な教授が、かつて『グレート・ギャツビー』からいくつかの文章をランダムに選び、村上春樹の最近の翻訳と Google 翻訳の結果を詳細に比較しました。村上氏の翻訳は上品で流暢だが、明らかに作者独特のスタイルが表れていると感じた。 Google 翻訳には文学的なセンスはありませんが、よりわかりやすくなっています。 機械翻訳の品質が向上するにつれて、異なる国の人々の間のコミュニケーションがより便利になります。携帯電話の助けを借りて世界中を旅行できる人はたくさんいます。外国語がわからない人でも、携帯電話の翻訳ソフトを使って地元の人とコミュニケーションをとるだけで世界旅行を終えた人もたくさんいます。翻訳家として働くネットユーザーは、現在の翻訳ソフトについて「18世紀の繊維労働者が蒸気機関を見た時の不安や恐怖はよく分かる」とさえ述べている。 確かに、データやレポートは素晴らしいように聞こえますが、人工知能の効果は人々が想像するほど魔法のようなものではありません。ネットユーザーの意見は、ある程度根拠に欠けている。特に、業界の専門家の見解では、機械翻訳の有効性は、人間による翻訳に取って代わるにはまだまだ遠いようです。実際、Google が翻訳アプリケーションで使用している人工知能技術は、特別なブラックテクノロジーではありません。早くも2015年に、Baiduはディープニューラルネットワークに基づく翻訳システムをリリースしており、MicrosoftのBing Translatorもニューラルネットワーク技術を使用して翻訳品質を向上させています。従来のフレーズベースの翻訳方法と比較して、ニューラル ネットワーク ベースの翻訳システムは、文章全体をエンコードし、コンテキスト情報を完全に関連付けて、より高品質の翻訳を生成することができます。 しかし、高品質な手動翻訳と比較すると、機械翻訳は人工知能という強力な武器を持っているにもかかわらず、翻訳の「上品で標準的な」要件を満たすことはできず、詩や小説を正確に翻訳することはさらに困難です。これらの欠点を補うために、多くの翻訳会社が人工知能 + 手動の人間機械翻訳モデルを採用しています。このモデルでは、人工知能が最初に最も基本的な翻訳を完了し、次に人間が翻訳結果を校正し、翻訳されたテキストの文学的および専門的な品質をさらに修正することで、文章の品質を確保しながらより高い効率を実現します。人工知能は、人手による校正にも関与します。人手による翻訳の修正結果を学習することで、正確な言葉の表現や翻訳者の言語習慣を学習し、翻訳能力を向上させ、将来的にはより自然な翻訳体験を人々に提供します。一方、人工知能システムは手動翻訳の結果を追跡し、翻訳者が軽微なミスを回避するのを支援することで、好循環を形成します。 人工知能は魔法のような読心術を実現できるのか? もちろん、翻訳は人々の間のコミュニケーションの障壁を打ち破るための第一歩にすぎません。人間は常に貪欲です。自由に話すことを望むだけでなく、自分と同じように考えてほしいとも思います。心を読むという概念は、SFでは珍しいことではありません。 1960年代に出版され、ネビュラ賞を受賞したアメリカのSF小説家アルフレッド・ベストの「My Destination Among the Stars」では、主人公のフレイが、復讐のための情報を得るために、読心術を使ってスコバス(感覚去勢を受けた異教徒)の心に入り込むという描写がある。 もちろん、小説に描かれているような本当の心を読むことは存在しません。しかし、人工知能の助けと分析により、心を読むことはもはや「夢物語」ではなくなりました。
昨年、Affectivaというスタートアップ企業が、「心を読む」タスクを実行できるAffdexという人工知能プログラムを発明した。人の顔をスキャンすることで表情を認識し、表情の認識結果に基づいて人の内面の感情の変動を解釈します。この感情認識技術は、アメリカのテレビシリーズ「Lie to me」のストーリーを現実世界に持ち込みます。このように、ほとんどの男性同胞にとって、女の子の心を理解することはもはや問題ではないと私は信じています。 偶然にも、MITのコンピュータサイエンスおよび人工知能研究所の研究者は最近、人工知能アルゴリズムとウェアラブルデバイスを組み合わせることで、会話中の音声とそれに対応する生理学的信号をリアルタイムで分析し、ディープラーニング技術を使用して、5秒ごとに会話全体の「感情スコア」を最大83%の精度で提供できると発表した。研究者らは「会話の感情をリアルタイムで分析できる」と指摘した。実際、この方法の原理は、機械が人の生理学的信号を読み取り、データの背後にある意味を解釈できるようにすることだ。
人々の日常のコミュニケーションだけでなく、公人でさえも人工知能による心を読むことから逃れることはできません。最近、米国の新大統領トランプ氏が伝統に従って就任演説を行った。 IBMの人工知能システム「ワトソン」を使って、トランプ大統領の演説をスピーチテキスト、感情分析、トーン分析、性格洞察の4つの側面から分析した人もいる。その結果、トランプ大統領の就任演説は弱々しく、就任演説で最も感情的な言葉は「悲しみ」だったことがわかった。このニュースを聞いたトランプ氏はどう感じるだろうか。 実際、一部の企業では、すでに人工知能の心を読む能力を機械と人間のコミュニケーションに活用しています。 RealDollはセックスロボットの製造で有名なアメリカの会社です。現在、彼のチームはセックスロボット用の人工知能脳を構築しており、常にユーザーの美的嗜好に適合するヒューマノイドロボットを訓練している。男性が人工知能の心を読む能力を使って女性を誘惑する以前から、機械が人間を誘惑するために人工知能が使われていたようだ。 もちろん、人工知能システムを使用して特定のグループの行動を分析し、社会発展の法則を探ることは、一種の「読心術」と見なすことができますが、その対象はもはや個々の人間ではなく、グループです。機械によって駆動され、この心を読む技術が極限まで発達すると、「三体」の宇宙人のように、すべての人の思考が一貫したものになるのでしょうか。「羅生門効果」を排除し、「地球意識」が実現するのでしょうか。それが良いことなのか悪いことなのかは、本当に議論の余地があります。 |
<<: 人工知能は 5 つの主要な地球規模の問題に解決策をもたらす | ダボス ブログ
>>: ビッグデータ、機械学習、ディープラーニングのためのコマンドラインツールの概要
4月27日、北京国家会議センターで2017年グローバルモバイルインターネットカンファレンス(GMIC...
人工知能 (AI) と機械学習 (ML) は、ビジネスの流行語から、より広範な企業での導入へと移行し...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
[[414747]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
「大学入試5年間・シミュレーション3年間」の数学の問題集が大幅パワーアップして登場! Microso...
デジタル化が進む世界では、すべてがスピードと個々の顧客ニーズの特定と対応を中心に展開されます。サービ...
機械学習では、製品やソリューションを構築する方法が多数あり、それぞれが異なることを前提としています。...
[51CTO.com からのオリジナル記事] 周知のように、人、物、オブジェクトは企業管理の 3 つ...
Agora.ioは3月9日、モバイルゲーム向けリアルタイム音声サービス「AMG Voice(Agor...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...