MITが脳制御ロボットを開発：脳波を使ってロボットのエラーを修正できる

ロボットが人間のように行動するためには、人間を理解する必要があります。多くの場合、それは妥協しなければならないことを意味します。たとえば、特定のタスクに対する具体的な指示を与えることによって、機械に人間の言語の複雑さを教えるのです。

しかし、人間の自然な延長のように動作し、私たちが思う通りに動くロボットを開発できたらどうなるでしょうか?

MIT のコンピュータサイエンスおよび人工知能研究所 (CSAIL) とボストン大学のチームは、人間が脳のみを使用してロボットの間違いを素早く修正できるフィードバックシステムを作成することで、この問題に取り組んでいます。MIT が開発したフィードバックシステムにより、人間のオペレーターは脳信号のみを使用してロボットの選択をリアルタイムで修正できます。

システムは、脳の活動を記録する脳波（EGG）検出器からのデータを使用して、ロボットが物体分類タスクを実行しているときに人間がロボットがミスを犯したことに気付いたかどうかを識別できます。チームが開発した新しい機械学習アルゴリズムは、システムが 10 ～ 30 マイクロ秒の空間で脳波を分類するのに役立ちます。

このシステムは今のところ比較的単純な二者択一しか扱えないが、論文の主任著者は、この研究は人間が将来もっと直感的にロボットを制御できるようになるかもしれないことを示していると述べた。

「コマンドを入力したり、ボタンを押したり、言葉を発したりすることなく、ロボットに何かをするように素早く指示できると想像してみてください」と CSAIL のディレクター、ダニエラ・ラス氏は言います。「このような効率的なソリューションは、工場ロボット、自動運転車、その他まだ発明されていないテクノロジーを監視する能力を向上させるでしょう。」

この研究で研究チームは、CSAILの元所長でiRobotの共同創設者でもあるロドニー・ブルックス氏が率いるRethink Robotics社が製造した「バクスター」ヒューマノイドロボットを使用した。

この論文は、ボストン大学（BU）の博士課程学生アンドレス・F・サラザール・ゴメス氏、CSAILの博士課程学生ジョセフ・デルプレト氏、CSAILの研究科学者ステファニー・ギル氏、顧問のラス氏およびボストン大学教授フランク・H・グエンサー氏によって執筆されました。この論文は、今年5月にシンガポールで開催されるIEEE国際ロボティクス・オートメーション会議（ICRA）に採択されました。

直感でロボットと対話する

これまで、EEG 制御ロボットでは、コンピューターが認識できる固定された方法で人間が「考える」必要がありました。たとえば、オペレーターの目の前には 2 本の光線があり、それぞれの光線はロボットの特定の作業タスクに関連しているため、機械に特定の作業を実行させるには、オペレーターはそのうちの 1 本を注視する必要があります。

このアプローチの欠点は、人間の思考活動のトレーニングプロセスとモデリングに非常に時間がかかり、労働集約的であることです。特に、ナビゲーションや建設作業を監督する人にとっては、これらのタスクに非常に集中した注意力が必要になるためです。

Rus 氏のチームは、プロセス全体をより自然なものにしたいと考えていました。この目標を達成するために、研究者らは、脳がエラーを認識するたびに生成されるエラー関連電位 (ErrP) と呼ばれる脳信号に注目しました。ロボットが選択しようとしていることを示した場合、システムは ErrP 信号を使用して、人間がマシンの決定に同意するかどうかを判断します。

「ロボットを見たら、その動作に心の中で同意するか、反対するかを判断するだけです」とラス氏は言う。「特定の考え方を身につける必要はありません。私たちの機械があなたに適応するのです。その逆ではありません。」

脳の ErrP 信号は非常に弱いため、システムを微調整して信号を分類し、フィードバックループで人間のオペレーターと連携させる必要があります。 ErrP 信号の一次検出に加えて、研究チームは、システムが人間からのエラー訂正信号を認識していない場合のいわゆる「二次エラー」を検出することも機械に教えました。

「ロボットが自分の決定に自信がない場合は、より正確な答えを得るために人間のフィードバック機構を作動させることができます」とギル氏は言う。「こうした信号は、精度を向上させ、人間と機械が常にコミュニケーションを取りながら決定を下す対話プロセスを作り出すのに非常に効果的です。」「

システムはまだ2番目のタイプの誤信号をリアルタイムで識別することはできませんが、それを識別できるようになればモデルの精度は90パーセント向上する可能性があるとギル氏は見積もっています。

また、ErrP 信号の強さはロボットのエラーの重大度を示すことがわかっているため、チームは将来のシステムをより複雑な複数選択タスクに拡張できると考えています。

サラザール＝ゴメス氏は、このシステムは言葉でコミュニケーションできない人にも有効であると指摘する。スペルなどの作業は、一連の個別の二者択一で達成できる。サラザール＝ゴメス氏はこれを、脳卒中患者のジャン＝ドミニク・ボービー氏が回想録『Le Scaphandre et le Papillon』を執筆することを可能にした瞬きのメカニズムの高度なバージョンに例えている。

「この研究は、効果的な脳制御ロボットや人工装具の開発に一歩近づくものだ」と、この研究には関わっていないフライブルク大学のコンピューターサイエンス教授、ウォルフラム・バーガード氏は語った。「人間の言語を意味のある機械可読信号に翻訳することの難しさを考えると、この研究は人間とロボットの協働の将来に広範囲にわたる影響を与えるだろう。」

このプロジェクトはボーイング社と国立科学財団から一部資金提供を受けた。以下は原著論文の要約です。

論文タイトル: EEG信号を使用したロボットのミスのリアルタイム修正

概要: 人間の協力者の脳活動を通じてロボットとコミュニケーションをとることで、直接的で高速なフィードバックループを実現できます。人間の協力者にとって、このコミュニケーション方法はシンプルで自然であり、直感に基づいてロボットと対話してさまざまなタスクを完了することも夢ではありません。この論文では、誤差関連ポテンシャル (ErrP) を閉ループロボット制御に適用する方法について説明します。 ErrP 信号は、予期しないエラーに反応して脳の活動から自然に発生するため、ロボットのタスクに特に役立ちます。我々は、人間のオペレーターが Rethink Robotics Baxter ロボットをリアルタイムで制御し、2 択タスクを実行しているときに ErrP 信号をデコードしました。また、この閉ループロボットタスク中に生成される潜在的なエラーに関連する二次的な相互作用信号を利用することで、分類タスクにおけるロボットのパフォーマンスを大幅に向上できることを示し、ロボットが人間からのフィードバックを得るための新しい手段を示唆しています。システム全体の設計と実装について詳しく説明し、リアルタイムのクローズドループおよびオープンループ制御の実験結果と、プライマリおよびセカンダリ ErrP 信号のオフライン分析を示します。実験課題を完了するために、一般集団の被験者を使用しましたが、これらの被験者は事前に訓練もスクリーニングも受けていませんでした。したがって、この研究は、シームレスなロボット制御を実現するための EGG ベースの回路アプローチの可能性を示しており、リアルタイムの直感的なインタラクションという目標に一歩近づきました。

図 1: 観察者の EEG 信号をリアルタイムでデコードすることで、ロボットは最初のアクションが間違っていたこと、そして適切なオブジェクトカテゴリに基づいて正しい選択を行うことを通知されます。

図 4: システムには、メインの実験コントローラ、Baxter ロボット、および EEG 取得および分類システムが含まれています。 Arduino システムは、コントローラーと EEG システムの間で情報を中継します。機械接続スイッチはロボットアームの動きの開始を検出します。

図 6: 単一の EEG データバッファー内の ErrP を識別するためのさまざまな前処理および分類段階。この決定はロボットの動作に即座に影響し、それが EEG 信号に影響し、フィードバックループが閉じます。

[この記事は、51CTOコラムニストのMachine Heart、WeChatパブリックアカウント「Machine Heart（id:almosthuman2014）」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<: Google、AIの地位強化のためデータサイエンスコミュニティKaggleの買収を発表

>>: 機械学習、データサイエンス、人工知能、ディープラーニング、統計の違いを理解する

ブログ

Appleは人工知能の分野で追い上げており、その視覚認識の成果は業界の賞を受賞した

ブログ

MITが脳制御ロボットを開発：脳波を使ってロボットのエラーを修正できる

シェア | 人工知能の典型的な12の事例

AIに「子犬」を認識させますか？ Facebookは変化を感知できるAIを構築

ロボティックプロセスオートメーションの導入を成功させるための 8 つのヒント

顔認識技術の倫理原則は何ですか?

[ディープラーニングシリーズ] PaddlePaddle と Tensorflow を使用したクラシック CNN ネットワーク AlexNet の実装

IBM Li Hongyan: 顧客の視点から「クラウドコンピューティングとデジタルインテリジェンスの活用」を考える

6144個のTPU、5400億個のパラメータ、バグ修正、ジョーク解釈など、GoogleはPathwaysを使用して大規模なモデルをトレーニングしました

Appleは人工知能の分野で追い上げており、その視覚認識の成果は業界の賞を受賞した

推薦する

脱ぐ！ドローンは1000億元の農薬市場の発展を加速させている

洪水期に緊急通信を確保するにはどうすればよいでしょうか?ドローンは誰もが好む新たな力となる

野生生物の保護: ドローン、ロボット、AI

CityDreamer: ワンクリックで境界のない 3D 都市を生成

ストーリーを伝えれば、動画が編集されます。AI による動画編集の自動化により、パンダの目を持つ編集者が解放されます。

人工知能の主な研究段階と将来の発展方向は何ですか?

YouTubeがAIツールシリーズを発表：動画作成の提案、背景の生成、多言語吹き替えが可能

大規模な言語モデルをローカルで実行する 5 つの簡単な方法

「顔認識」はあなたの「顔」を盗む

ChatGPTが公式検出ツールを削除、AIテキストは識別できないことを認める

素晴らしい瞬間を振り返りましょう！ IEEE Spectrumが2023年の最もホットなAIストーリーをレビュー