2 匹の霊長類が長期間一緒に飼育されると、同居人、同僚、家族の即時の行動をすぐに予測できるようになります。他人の行動を予測する人間の能力により、私たちは共に生活し、働くことが容易になります。対照的に、最も賢く、最も先進的なロボットでさえ、この種の社会的コミュニケーションに関しては無知なままです。しかし、それは変わりつつあるかもしれない。 互いのあらゆる動きを予測できる老夫婦のように、コロンビアエンジニアリング社のロボットは最近、最初の数フレームのビデオ映像に基づいてパートナーロボットの将来の行動や目標を予測するスキルを習得した。 この研究はコロンビア工科大学のクリエイティブ・マシン・ラボで行われ、機械工学教授のホッド・リプソン氏が主導しており、ロボットに視覚的な観察のみで他のロボットの目的を理解し予測する能力を与えるというより広範なプロジェクトの一部である。 研究者たちはまずロボットを作り、それをおよそ3×2フィートの大きさのベビーサークルの中に設置した。彼らは、目に映る緑色の円を探し出してそれに向かって移動するようにロボットをプログラムした。しかし、問題があります。ロボットがカメラから緑色の円を見て、それに向かって直接移動してしまうことがあるのです。しかし、時には、緑色の円が背の高い赤い段ボール箱で遮られることがあり、その場合、ロボットは別の緑色の円に向かって移動するか、まったく動かなくなります。 ロボットは、仲間のロボットが2時間歩き回るのを観察した後、ロボットの目的地と進路を予測し始めました。さまざまなシナリオにわたって、観察ロボットは、障害物に向かって移動するように明示的に指示することなく、最終的にパートナーの目標と進路を 98 回予測することができました。 「私たちの最初の結果は非常に興味深い」と研究の主執筆者であるボーユアン・チェン氏は述べた。この研究は、コンピューターサイエンスの助教授であるカール・フォンドリック氏と共同で行われ、Nature Scientific Reports に掲載されています。 「私たちの研究結果は、ロボットが他のロボットの視点から世界を見ることができる方法を示し始めています。観察者はいわばパートナーの立場に立って、指示されなくても、パートナーが自分の視点から緑の円を見ることができるかどうかを理解することができます。これは共感の原始的な形かもしれません。」 実験を計画する際、研究者たちは、観察ロボットが測定対象ロボットの短期的な行動を予測することを学習することを期待した。しかし、研究者たちが予想していなかったのは、わずか数秒のビデオをきっかけに、観察ロボットが同僚の将来の「動き」を正確に予測できるようになるということだった。 研究者らは、この研究でロボットが行った行動は人間の行動や目的よりもはるかに単純であったことを認めている。しかし、彼らはこれが認知科学者が「心の理論」(ToM)と呼ぶものをロボットに与える第一歩になるかもしれないと信じている。 3 歳前後になると、幼い子どもは他の人には異なる目標、ニーズ、視点があるかもしれないということを理解し始めます。これにより、かくれんぼなどの楽しいアクティビティだけでなく、嘘をつくなどのより複雑な操作も可能になります。より広い意味では、「心の理論」は、人間と霊長類の認知能力を特徴づける重要な特徴であり、協力、競争、共感、欺瞞などの複雑で適応的な社会的相互作用の重要な要素であると考えられています。 さらに、予測を言葉で説明する点では、人間はロボットよりも優れています。研究者たちは、人間の言語の難しい問題を回避するために、観察ロボットにテキストではなく画像の形で予測を行わせた。しかし、リプソン氏は、視覚を通じて将来の行動を予測するロボットの能力は特別なものではないと推測している。「私たち人間も視覚的に考えることがあります。私たちは言葉ではなく心の目で未来を想像することが多いのです。」 リプソン氏は多くの倫理的問題があることを認めている。この技術によりロボットはより回復力と有用性を持つようになるが、ロボットが人間の思考を予測できるようになれば、その思考を操作することも学ぶようになるかもしれない。 「ロボットが常に指示に従う受動的な機械であるとは限らないことは認識している」とリプソン氏は言う。「他の高度なAIと同様に、政策立案者がこの技術を管理し、私たち全員が恩恵を受けられるようにしてほしい」 この研究のタイトルは「ロボットの心の理論のための視覚行動モデリング」です。 |
<<: 新しい量子アルゴリズムは非線形方程式を解読しました。コンピューターは人間に取って代わり、預言者になれるのでしょうか?
近年、深層畳み込みニューラル ネットワーク (DCNN) により、画像の分類と認識が大幅に向上しまし...
セキュリティ専門家の観点から見ると、現在、AI と機械学習を導入する必要性が高まっています。彼らは、...
2021年、研究者たちは一連のマイクロモデルを訓練しているときに驚くべき発見をしました。それは、長期...
GPT-3、CLIP、DALL+などの大規模モデルのニーズや、ニューラル言語モデルに似たスケーリング...
[[271243]]視覚に関して、AIと人間の間にはどれくらいのギャップがあるのでしょうか?カリフォ...
ロイターが確認したメモによると、10月12日、米宇宙軍はデータセキュリティに関する懸念から、職員によ...
明らかに、AI とデータ分析の世界はダイナミックな変化の真っ只中にあります。将来は、イノベーションと...
[[206395]]さまざまな興味の組み合わせに応じて必要な動画を検索できるのは、毎日無数の動画コン...
我が国の戦略的新興産業の一つであるドローンは近年急速に発展し、技術、製品、応用、市場において満足のい...
医薬品の発見と開発の加速は大きなビジネスであり、業界の運営コストは高いため、急速に成長しているこの業...
この記事では、オープンソースの Large Language Multi-Modal モデルを使用し...
低ランク適応 (LoRA) は、基本的な LLM が特定のタスクに効率的に適応できるようにする、一般...