数時間のビデオを視聴するだけで人間のチャットを真似できますか? Facebookのロボットは表情が豊か

数時間のビデオを視聴するだけで人間のチャットを真似できますか? Facebookのロボットは表情が豊か

ヒューマノイドロボットの類似性は人間の好感度に比例するわけではありません。 1970年に日本のロボット工学の専門家である森政弘氏が提唱した不気味の谷理論によれば、物体の擬人化の度合いが増すにつれて、人間の反応は増加-減少-増加の曲線を描くという。擬人化の度合いが一定レベルに達すると、人間に対する好感度は大幅に低下し、擬人化されたキャラクターが怖いと感じるようになることもあります。

不気味の谷理論/Wikipedia

Facebook は、できるだけ早くロボットが不気味の谷を乗り越えられるように取り組んでいます。

最近、Facebook Artificial Intelligence Lab (FAIR) の研究者たちは、感情表現が得意なロボットを開発しました。これは、人間の Skype チャット ビデオを数時間観察した後、人間の表情を模倣できる AI アルゴリズムによって制御される仮想アニメーション ロボットです。

68面ランドマークブロック

人間が感情を表現する方法をより正確にシミュレートするために、研究者はアニメーション内の顔を68のブロックに分割し、Skype会話中にこれらの部分の変化を観察することに焦点を当てました。会話中、人間のうなずきやまばたき、口の動きの変化などが反映され、ロボットはこれらの表情の変化を学習します。

上の写真は会話中の人間の表情を示しており、下の写真は表情を追跡するシステムを示している。

しばらく観察すると、アニメーション化されたロボットは、可能性のある表情をリアルタイムで予測できるようになります。ビデオ内の人物が笑っている場合、ロボットは口を開けたり、首を傾げたりすることもあります。

テスト結果

その後、Facebookの研究者らは一連のテストを実施した。ボランティアたちは、人間同士の会話のオリジナルビデオや、訓練されたロボットの模擬応答を視聴し、ロボットのパフォーマンスを自然でリアルだと評価した。

写真の線の高さは、口(左)と目(右)の開閉度合いを示しています。ユーザー(上)とエージェント予測(下)の表情は基本的に同じであることがわかります。

現時点ではアルゴリズムはアニメーションでしか表示できないため、アルゴリズムによってサポートされるヒューマノイドロボットがどのように反応するかは不明です。

イスラエルのテルアビブ大学の博士課程の学生、ゴレン・ゴードン氏は、顔の表情によるコミュニケーションの基本ルールを学ぶだけでは、本当の会話の相手を作るのに十分ではないと語る。「本当の表情は、考えていることや感じていることに基づいているのです。」

「この場合、フェイスブックのシステムは平均的な性格を作り出している」とカー​​ネギーメロン大学言語技術研究所の准教授、ルイ・フィリップ・モレンシー氏は言う。将来、ロボットはより複雑な性格を持つようになるか、会話相手に応じて性格を調整できるようになるかもしれません。

ロボットは人間同士のやり取りにおけるこうした微妙な要素をうまく処理できないとゴードン氏は言う。彼はまた、ロボットに対する期待を表明した。「ある時点で、私たちは不気味の谷を抜けて向こう側へ歩み出るだろう。」

[[202711]]

大阪大学知能ロボット研究所が開発したヒューマノイド型女性アナウンサー「オトナロイド」

Facebook社は今月24日にバンクーバーで開催されるIROS 2017でこの技術を実演する予定で、この技術に関する論文「Learn2Smile: 観察を通じて非言語的インタラクションを学ぶ」を公開している。

抽象的な

本稿では、人間とエージェントの対面コミュニケーションにおける非言語的な顔の手がかりを研究し、ユーザーの表情に基づいてエージェントの顔の感情表現を自動的に学習して更新する方法を提案します。私たちは、外部の人間による監督なしに、人間同士が会話している何百ものビデオを使ってニューラル ネットワークをトレーニングしました。

実験結果では、当社のインテリジェントな顔注釈モデルが人間の表情を長期間にわたって予測できることが示されており、比較結果からも、このモデルがベースライン手法よりも大幅に優れていることが示されています。 ***、モデルのパフォーマンスをより深く理解するために、より詳細な調査を実施しました。

この研究のデータセットは、この分野の他の研究者が利用しやすいように公開されています。

<<:  注目を浴びるAIとゲームは、どんな火花を散らすことができるのでしょうか?

>>:  AIの冷却:ディープラーニングは万能薬ではない

ブログ    

推薦する

顔認識システムの技術的プロセスの分析

顔認識は、顔の特徴に基づいて人物を識別する生体認証技術です。カメラまたはビデオカメラを使用して、顔を...

コンピューティングパワーのコストが急激に上昇したため、AIスタートアップがGoogleやMicrosoftなどの大手に挑戦することが難しくなった。

2月20日のニュースによると、コンピューティングコストが急騰しているため、人工知能業界の新興企業は...

ジェネレーティブ AI によるヘルスケアの変革: 新たなユースケースと将来の可能性

ヘルスケアとウェルネスのダイナミックな分野では、ANI と生成 AI の組み合わせによる革命が進行し...

ChatGPTは時間管理の達人になるお手伝いをします

時間管理は、働く人にとって非常に重要です。適切な管理は、仕事の効率と生活の質を大幅に向上させます。タ...

...

...

人工知能とサイバーセキュリティは諸刃の剣

[[379153]] [51CTO.com クイック翻訳] 研究によると、人工知能技術はさまざまな業...

AIが独自に病気を診断できる場合、人間の医師は責任を回避できるのでしょうか?

健康診断のために病院に行くところを想像してください。診察室に入るとすぐに、看護師があなたの写真を撮り...

...

ブロックチェーンのコンセンサスアルゴリズムとは何ですか?

所有権や金額などの取引の基本的な特性は、基本的な数学的特性に基づいて機能する公開鍵暗号化のおかげで簡...

自撮り写真でAIがあなたの顔を認識できないようにする方法

現在、顔認識システムがプライベートな写真で訓練されるのを防ぐツールがますます増えている。個人の写真を...

多くのビッグデータサイエンティストが仕事を辞めた?理由を説明しましょう。

はい、私はデータ サイエンティストです。はい、あなたはそれを正しく読みました。しかし、誰かがそれを言...

データ構造とアルゴリズム: 最小全域木、数秒で理解できます!

[[426679]]序文データ構造とアルゴリズムのグラフ理論において、最小全域木アルゴリズムは、比...

サイバー攻撃が自動運転車に勝てない理由

マルウェア、ランサムウェア、ウイルス、サービス拒否攻撃など、これらの脅威は回復が困難なため、企業を窮...