ロボット: 何を見ているんですか?人間とロボットのアイコンタクトが意思決定を遅らせる、サイエンス誌に掲載

ロボット: 何を見ているんですか?人間とロボットのアイコンタクトが意思決定を遅らせる、サイエンス誌に掲載

あなたがロボットを見つめると、ロボットもあなたを見つめます。

視線は人と人との間のシグナルであり、コミュニケーション、相互作用、そして自分の意図を伝えることを意味します。 「あなたが私を見ると、言葉がなくてもあなたが何を言いたいのか分かります。」

しかし、人間とロボットが互いの目を見つめ合うと何が起こるのでしょうか?

[[421553]]

イタリア工科大学の研究者らは、ヒューマノイドロボットの視線が人間の神経活動に影響を及ぼし、意思決定プロセスに影響を及ぼし、遅延を引き起こす可能性もあることを発見した。人間はロボットの視線を社会的シグナルとして認識しており、これらの発見により、同僚、臨床サポートサービス、在宅アシスタントなど、ヒューマノイドロボットの潜在的な応用分野が拡大します。

「InStance」と呼ばれるこのプロジェクトは、「いつ、どのような条件下で人々がロボットを意識のある存在として認識するか」を研究する。

論文アドレス: https://www.science.org/doi/10.1126/scirobotics.abc5044

現在、この研究はScience Roboticsに掲載されています。論文の著者には、Marwen Belkaid、Kyveli Kompatsiari、Davide de Tommaso、Ingrid Zablith、Agnieszka Wykowska が含まれます。

日常のほとんどの状況において、人間の脳は意思決定だけでなく、他人の行動を予測することにも関与しています。視線は他人の意図、目標、将来の決断に関する情報を提供することができます。人間は他人の目に注意を払っており、誰かが自分を見たり、環境内の特定の出来事や場所を見たりしたときに脳が強く反応します。現在、研究者たちは人間とロボットの間のこのような相互作用に注目しています。

[[421554]]

Marwen Belkaid、Kyveli Kompatsiari、Davide de Tommaso、Ingrid Zablith、Agnieszka Wykowska (チームリーダー)。画像出典: IIT-Istituto Italiano di Tecnologia。

「ロボットは今後ますます私たちの日常生活に登場してくるでしょう。そのため、ロボット設計の技術的側面だけでなく、人間とロボットの相互作用の側面も理解することが重要になります」と、この研究の主任研究者で論文の筆頭著者であるアニエスカ・ウィコフスカ氏は述べた。

研究チームは、40人の参加者にロボットiCubを使った戦略ゲームをプレイしてもらい、参加者の行動と神経活動を測定した。神経活動は脳波記録(EEG)を使用して測定された。このゲームは、自動車の衝突コースで互いに接近する 2 人のドライバーをシミュレートし、結果はプレイヤーが方向転換するか直進するかによって決まります。

このゲームの実験では、2人のプレイヤー(参加者とロボット)の間でテーブル上でゲームを操作するマシンがあります(図1A)。ゲーム内の各プレイヤーは車を操作します。車が互いに近づき、衝突しそうになると、ゲーム画面が 5 秒間黒くなり、両方のプレイヤーは直進するか方向転換するかを選択する必要があります。実験で最も重要な点は、参加者にロボットを見るように求められ、ロボット iCub の視線には次の 2 つの状況が含まれていたことです。

参加者を直接見つめる、つまり 2 人のプレーヤーがお互いを見つめます。

iCub は横を向いて視線をそらすことでアイコンタクトを避けます。

両方のプレイヤーはアクション ボタンを覆うシールドを持ち、対戦相手が選択を予測できないようにします。ゲームの考えられる結果は次のとおりです。

  • 両方が直進して衝突した場合、両方の損失は最大になります。
  • 両者は逸脱し、最高の共同ゲインを達成します。
  • 最も高い個人的利益をもたらす直線は 1 つだけです。

研究者たちは、iCub が相互に視線を合わせているとき、つまり iCub が参加者を見つめているとき、参加者の反応が遅くなることを発見しました。遅延した反応は、相互の視線がより高い認知努力と関連していることを示している可能性があります。一方で、参加者の視線は iCub の選択に関する推論を深めることにつながり、他方では、タスクとは無関係な視線刺激の抑制度を高める可能性があります。

ロボットとポーカーをプレイすることを想像してください。次に何をするか決める必要があるとき、ロボットはあなたを見て、目をそらすと決定を下します。ウィコウスカ氏は、人間のプレイヤーの脳も、ロボットの視線を「無視」しようとするという、面倒でコストのかかるプロセスを経なければならないと述べた。

これらの結果は、ロボットの視線が人間の脳の「社会的認知」メカニズムを「乗っ取り」、ロボットが社会的エージェントのように反応することを示しています。この意味では、ロボットの「社会性」は必ずしも人間にとって有益であるとは限りません。ロボットとのやりとりが楽しいとしても、人間の意思決定のパフォーマンスやスピードを妨げる可能性があります。

参加者のパフォーマンスと応答時間。

参加者は計算モデルを使用して iCub の動作について推論しました。下の図(a)はモデルの概略図である。強化学習モデル (RL) は、最近選択されたアクションとその結果に基づいて決定を下します。仮想ゲーム モデル (Fic) は、ゲームのペイオフ マトリックスと対戦相手の行動の予測に基づいて決定を下します。Inf モデルも同様に、対戦相手もプレイヤーの選択を予測し、対戦相手の決定の予測に対する自身の行動の影響を組み込んでいるものと想定します。下のパネル (b) は、参加者の選択に一致する影響モデルの全体的な対数尤度比が他の 2 つのモデルよりも大幅に大きいことを示しています。これは、ゲーム中の iCub の推論レベルが高いことを示しています。

iCub の動作に関する参加者の推論の計算モデル。

Wykowska 氏と彼女の研究チームは、これらの研究結果がロボット工学エンジニアが特定のアプリケーション コンテキストに最も適切な動作を示すロボットを設計するのに役立つことを期待しています。たとえば、自閉症の実験的治療の一部である iCub ロボットのように、社会的行動を備えたヒューマノイド ロボットは、高齢者や子供の介護に使用できます。一方、工場のセットアップや航空管制などの作業に集中する必要がある場合、社会的信号を発するロボットは気を散らすものになる可能性があります。

<<:  1 つのニューロンには 5 ~ 8 層のニューラル ネットワークがあります。ディープラーニングの計算の複雑さは生物学によって克服されています。

>>:  自然言語処理のためのOne Hot Modelについて

ブログ    
ブログ    

推薦する

世界で最も強力なオープンソース モデルが一夜にして所有者が変わりました。 Google Gemma 7B が Llama 2 13B を圧倒、オープンソース戦争が再燃

真夜中に雷鳴が轟いた。Google は本当に LLM をオープンソース化したのか? !今回、オープン...

cnBeta は、開発者が AI アプリケーションを構築するのに役立つ 3 つの新しい機械学習ツールをリリースしました。

TechCrunchのウェブサイト、北京時間9月25日によると、多くの競合他社と同様に、Micro...

AIによる顔の変形がトレンドになり、人工知能の世界があなたの探索を待っています

昔、携帯電話がなかった頃は、写真を撮りたい人は写真館に行かなければなりませんでした。写真を撮る機会は...

OpenAIはニューヨークタイムズの声明は一方的であると不公平だと叫び、アンドリュー・ン氏もそれを擁護した。

2023年末、ニューヨーク・タイムズはマイクロソフトとOpenAIを訴えるための強力な証拠を提示し...

将来の量子コンピューティング攻撃の脅威に対処するため、我が国は新たなデータ保護暗号アルゴリズムの研究を開始しました。

量子コンピューティングの継続的な進歩により、コンピュータ能力の大幅な向上がネットワーク セキュリティ...

9つの主要な回帰アルゴリズムと例のまとめ

線形回帰は、多くの場合、機械学習やデータサイエンスで最初に学ぶアルゴリズムです。シンプルでわかりやす...

メタ研究者が新たなAIの試み:地図や訓練なしでロボットに物理的なナビゲーションを教える

Meta Platformsの人工知能部門は最近、少量のトレーニングデータのサポートにより、AIモデ...

清華大学とハルビン工業大学は大規模なモデルを 1 ビットに圧縮し、携帯電話で大規模なモデルを実行するという夢が実現しつつあります。

ビッグモデルが普及して以来、ビッグモデルを圧縮したいという人々の欲求は減ることはありません。大規模モ...

画像も感情を伝えることができるのでしょうか?ロチェスター大学のチームが新しいコンピュータービジョンのタスクを提案

画像スタイルの転送?声の感情移入?いいえ、それはイメージの感情的な伝達です。コンピュータビジョンの分...

AIの未来: 汎用人工知能

人工知能を真に理解するために、研究者は、環境に対する人間のような理解を再現できる基礎的な AGI 技...

ジェミニはソラの動画がAI生成だと一目でわかるのか?数百万のトークンのコンテキスト機能がGPT-4を圧倒

Google Gemini 1.5 が、その見出しをさらった「犯人」であるSoraと出会ったら何が起...

機械学習プロジェクトにおける特徴エンジニアリングの 5 つのベスト プラクティス

私たちは長年にわたり、機械学習プロジェクトで何が機能し、何が機能しないかを特定するために、さまざまな...

データ サイエンスの初心者の場合は、まずはここにいくつかのアルゴリズムを紹介します。

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

Scikit-learn をご存知ですか?これらの機能をご存知ですか?

[[229302]]ビッグデータ概要編纂者: 王暁奇、大潔瓊、アイリーンScikit-learn ...

GPT や Llama などの大規模モデルには「反転の呪い」があります。このバグを軽減するにはどうすればよいでしょうか?

中国人民大学の研究者らは、Llamaなどの因果言語モデルが遭遇する「反転の呪い」は、次のトークン予測...