陳根:人工知能は人間と機械の間の感情的な溝を埋めている

陳根:人工知能は人間と機械の間の感情的な溝を埋めている

長い間、感情があるかどうかは、人間と機械を区別する重要な基準の一つでした。つまり、機械が感情を持っているかどうかも、ロボットの人間性を判断する重要な要素の1つです。

現在、人工知能は急速な成長と全面的な拡大の傾向を示しています。一方で、人工知能は数学的演算、論理的推論、エキスパートシステム、ディープラーニングなど、より深い知能に向けて発展し続けており、他方では、スマートフォンからスマートホーム、スマート交通からスマートシティなど、社会のさまざまな分野に人工知能が拡大し続けています。

「知覚知能」は徐々に理解力と表現力を備えた「認知知能」へと変化し、機械に感情を与えることは避けられない流れとなっている。人工知能の父、マービン・ミンスキーはかつて、「機械が感情をうまくシミュレートできないなら、人々は機械が知的であるとは決して思わないだろう」と述べました。

人工知能に人間の感情を理解してもらいたいなら、人工知能の感情コンピューティングから始める必要があります。

[[381521]]

人工知能は人間の感情を理解する

人工知能に人間の感情を理解させようとするのは新しい研究ではありません。

1997 年に、MIT メディアラボのピカード教授は感情コンピューティングの概念を提唱しました。ピカード教授は、アフェクティブ・コンピューティングは感情に関連しており、感情から生まれた、あるいは感情に影響を与えるコンピューティングであると指摘しました。簡単に言えば、感情コンピューティングは、人間の感情を認識、理解、表現する能力をコンピューターに与えることで、コンピューターをよりインテリジェントにすることを目的としています。

それ以来、感情コンピューティングという新興の科学分野が多くの情報科学や心理学の研究者の視野に入り始め、世界中で人工知能から人工感情への移行の序章が開かれました。

感情コンピューティングは、感情の「認識」、「表現」、「意思決定」を含む総合的な技術として、人工知能の感情化における重要なステップです。 「認識」は機械が人間の感情を正確に識別し、不確実性や曖昧さを排除できるようにすることです。「表現」は人工知能が言語、音声、姿勢、表情などの適切な情報媒体の形で感情を表現することです。「意思決定」は主に感情のメカニズムを利用してより良い意思決定を行う方法を研究します。

認識と表現は、感情コンピューティングにおける 2 つの重要な技術的リンクです。感情認識は、感情信号の特徴を抽出し、人間の感情を最もよく表す感情特徴データを取得します。これに基づいて、感情の外部表現データと内部感情状態とのマッピング関係を見つけるためのモデリングが行われ、音声感情認識、顔表情認識、生理信号感情認識など、人間の現在の内部感情タイプが識別されます

顔の表情認識は明らかに感情認識の重要な部分です。人間のコミュニケーションの過程では、感情の 55% が表情を通じて伝達されます。 1970年代、アメリカの心理学者エクマンとフリーゼンは、現代の表情認識に関する先駆的な研究を行いました。

エクマンは、幸福、怒り、驚き、恐怖、嫌悪、悲しみという 6 つの基本的な人間の表情を定義し、認識されるオブジェクトのカテゴリを決定しました。また、顔の動作コーディング システム (FACS) を確立しました。これにより、研究者は、システムによって分割された一連の顔の動作単位に従って顔の動きを記述し、顔の動きと表情の関係に基づいて微妙な表情を検出できるようになりました。

感情認識は現在最も可能性の高いアプリケーションです。たとえば、商業企業は感情認識アルゴリズムを使用して、消費者が広告を見るときの表情を観察します。これにより、企業は製品の売上が増加するか、減少するか、または同じままかを予測し、製品開発の次のステップに備えることができます。

機械は人間の感情を認識し理解するだけでなく、感情的なフィードバック、つまり機械による感情の合成と表現も提供する必要があります。人間が感情を表現するのと同様に、機械の感情表現は音声、表情、ジェスチャーなどのマルチモーダル情報を通じて伝達されます。したがって、機械感情合成は、感情音声合成、表情合成、ボディランゲージ合成に分けられます。

その中でも、声は感情を表現する主な手段の一つです。人間は声を通じて他人の感情的な状態を常に簡単に判断することができます。スピーチの感情には、主にスピーチに含まれる言語内容と音自体の特徴が含まれます。明らかに、機械の感情的な音声により、消費者はそれを使用するときに、より人間的で温かい気持ちになります。

感情コンピューティングの意思決定の観点から見ると、人間が特定の問題を解決する場合、純粋に合理的な意思決定プロセスは最適な解決策ではないことが多いことが、多数の研究で示されています。意思決定のプロセスにおいて、感情を加えることで、より良い解決策を見つけやすくなるかもしれません。したがって、AI の意思決定プロセスに感情変数を入力すると、機械がより人道的な決定を下すのに役立つ可能性があります

Microsoft の研究者は、人間の神経系の反応に関連する末梢脈拍測定からの内在的報酬に基づく新しい強化学習方法を提案することで、この疑問に答えました。研究者たちは、この報酬関数が強化学習による疎らで偏った問題の解決に役立ち、それによってサンプリング効率が向上すると仮説を立てています。

[[381522]]

「感情」のギャップを越えることと越えないこと

感情知能は、機械をより賢くするための鍵です。感情を持つ機械は、より多用途で、より強力で、より効率的になるだけでなく、人間の価値観にも近づきます。人間の科学者たちの長期にわたる努力のおかげで、人間の脳とコンピューターの間の「感情」のギャップは埋められつつあります。

2014年5月29日、マイクロソフトアジアインターネットエンジニアリングアカデミーが開発した第1世代のXiaoIceがWeChatパブリックベータ版を開始し、3日以内に150万以上のWeChatグループと1,000万人以上のユーザーの支持を獲得しました。 Microsoft XiaoIce は、感情コンピューティングを初めて習得した人工知能と言えます。

マイクロソフトのXiaoice開発チームの責任者であるLi Di氏は、人工知能プラットフォームとして、Xiaoiceは技術、製品、データの間で好循環を形成していると語った。つまり、Xiaoice が蓄積したビッグデータは、Xiaoice が自己進化を実現するのに十分なものです

2017年5月、マイクロソフト小氷は人工知能が作成した初の詩集『太陽はガラス窓を失った』を出版した。一部の詩は『青春文学』などの出版物に掲載されたり、インターネットに投稿されたりしており、作品の著作権と知的財産権を享受していると発表された。 XiaoIce が詩の中で述べたように、「この世界では、私には美しい意味がある。」

現在、XiaoIce は人間との会話を数百億回蓄積し、そこから膨大な量の履歴データを抽出しています。この膨大なデータにより、XiaoIce は将来の会話を 50% 以上の精度で正確に判断することができます。ある程度、シャオビンはすでに予備的な記憶、認知、意識能力を発達させています

[[381523]]

現在、多数の統計技術モデルの出現とデータリソースの蓄積により、この分野における感情コンピューティングの応用はより成熟しつつあります。もちろん、どんな技術にも独自の技術曲線があり、感情コンピューティングの開発は順風満帆ではありません。

一方で、感情コンピューティングは、集団感情と個人感情の間の矛盾に必然的に直面することになります。感情の認識や理解には個人差があるため、感情のパーソナライゼーションは応募プロセスにおいて非常に重要な考慮事項となります。しかし、パーソナライゼーション機能と一般化機能は矛盾しており、感情コンピューティングにおける技術的な困難となっています。

実際、過去の感情研究のデフォルトの前提と仮定は、感情のグループ共通性、つまりグループが同じ外部データを表現する場合、その内部の感情状態は一貫しているというものでした。これにより、個人の独自性に焦点を当てる場合のデータと方法、つまり必要な個人データの量をどのように制御するかという疑問が生じます。実際のアプリケーションシナリオでは、すべての人のいわゆる固有データを本当に取得できるのでしょうか?

一方、それは個人の感情の計算です。感情の揺れ幅を制御することで、活発で大げさな性格の人や、静かで内向的な人のさまざまな感情の起伏をシミュレートすることは可能ですが、一般的な感情を使用しても普通の人をシミュレートすることは現在非常に困難です。機械は感情の切り替えごとに飛び回っており、人間のように自然で一貫した変化を維持するのは困難です。

さらに、個人の感情分析の問題は、インタラクションの分野で新たな応用を生み出し続けています。たとえば、インテリジェントなカスタマー サービスの分野では、ユーザーの感情を効果的に検出できます。また、ますます成熟する嘘発見技術は、生理学的パラメーター、または音声やビデオ信号、さらには音声のガイダンスによる微妙な心理的変動を反映するその他のパラメーターを通じて感情分析を行うこともできます。

しかし、パーソナライズされたサービスではプライバシー保護という課題も生じます。パーソナライズされた感情コンピューティングでは、必然的にユーザーデータがさらに転送されます。この場合、プライバシーが効果的に保護されるかどうかはまだ不明です。

将来的には、感情コンピューティングが従来の人間とコンピュータのインタラクションのモードを変え、人間と機械の感情的なインタラクションを実現することが予測されます。知覚知能から認知知能へのパラダイムシフト、データ科学から知識科学へのパラダイムシフトにより、人工知能は将来的に私たちにさらに良い答えを与えてくれるでしょう

<<:  アリペイは65歳以上の高齢者が直接人間サービスを利用できる専用ホットラインを立ち上げた。

>>:  2021年の主なAIトレンド:AIチップスタートアップのM&Aの可能性

ブログ    
ブログ    
ブログ    

推薦する

5つの重要なステップ!ディープラーニングモデルを構築するにはどうすればいいですか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

...

...

ディープラーニングは本当にゼロから始められるのでしょうか?

[[203908]]誰かが尋ねたディープラーニング — どこから始めればよいですか?今はTenso...

DeepMind のブラック ボックス解読の第一歩: ニューラル ネットワークの認知原理は人間のものと同じであることが判明しました。

人間は、画像内の物体を認識して推論することから、超人的なレベルで Atari ゲームや囲碁をプレイす...

人工知能は意識を発達させることができるか?人間の心をシミュレートすることがAIの究極の目標である

人工知能に関する議論では意識が重要な役割を果たします。人工知能法(AIS)は、情報分野の企業が取り組...

...

...

数学が苦手でも機械学習を学ぶことはできますか?

[[381131]] 01 「機械学習は簡単に習得できますか?」これは私が最も頻繁に聞かれる質問で...

3省庁:AI分野の大学院生の育成を加速し、世界の科学技術の最先端を掌握

教育部のウェブサイトによると、教育部、国家発展改革委員会、財政部はこのほど、「『双一流』建設大学にお...

英国メディアが人工知能の軍事応用とそのリスクを分析

[[440377]]はじめに12月7日、英国のドローン戦争ウェブサイトは、人工知能が各国の軍事部門に...

エッジAIを真の変革に

エッジ AI の導入は幅広い業界で増加しています。この傾向が続くと、ビジネスだけでなく社会も変革する...

健康コードがないと旅行するのは難しいですか?顔認識により健康コードのバリアフリー利用が可能に

「公共交通機関では健康コードの提示が求められますが、提示できない場合はどうすればよいですか?」予防と...

高等教育における人工知能の3つの革新的な応用

高等教育の専門家は、AI と完全に連携する準備をしなければ、機会を逃したり、学生とのつながりが断たれ...