MITが脳制御ロボットを開発:脳波を使ってロボットのエラーを修正できる

MITが脳制御ロボットを開発:脳波を使ってロボットのエラーを修正できる

ロボットが人間のように行動するためには、人間を理解する必要があります。多くの場合、それは妥協しなければならないことを意味します。たとえば、特定のタスクに対する具体的な指示を与えることによって、機械に人間の言語の複雑さを教えるのです。

しかし、人間の自然な延長のように動作し、私たちが思う通りに動くロボットを開発できたらどうなるでしょうか?

MIT のコンピュータサイエンスおよび人工知能研究所 (CSAIL) とボストン大学のチームは、人間が脳のみを使用してロボットの間違いを素早く修正できるフィードバック システムを作成することで、この問題に取り組んでいます。MIT が開発したフィードバック システムにより、人間のオペレーターは脳信号のみを使用してロボットの選択をリアルタイムで修正できます。

システムは、脳の活動を記録する脳波(EGG)検出器からのデータを使用して、ロボットが物体分類タスクを実行しているときに人間がロボットがミスを犯したことに気付いたかどうかを識別できます。チームが開発した新しい機械学習アルゴリズムは、システムが 10 ~ 30 マイクロ秒の空間で脳波を分類するのに役立ちます。

このシステムは今のところ比較的単純な二者択一しか扱えないが、論文の主任著者は、この研究は人間が将来もっと直感的にロボットを制御できるようになるかもしれないことを示していると述べた。

「コマンドを入力したり、ボタンを押したり、言葉を発したりすることなく、ロボットに何かをするように素早く指示できると想像してみてください」と CSAIL のディレクター、ダニエラ・ラス氏は言います。「このような効率的なソリューションは、工場ロボット、自動運転車、その他まだ発明されていないテクノロジーを監視する能力を向上させるでしょう。」

この研究で研究チームは、CSAILの元所長でiRobotの共同創設者でもあるロドニー・ブルックス氏が率いるRethink Robotics社が製造した「バクスター」ヒューマノイドロボットを使用した。

この論文は、ボストン大学(BU)の博士課程学生アンドレス・F・サラザール・ゴメス氏、CSAILの博士課程学生ジョセフ・デルプレト氏、CSAILの研究科学者ステファニー・ギル氏、顧問のラス氏およびボストン大学教授フランク・H・グエンサー氏によって執筆されました。この論文は、今年5月にシンガポールで開催されるIEEE国際ロボティクス・オートメーション会議(ICRA)に採択されました。

直感でロボットと対話する

これまで、EEG 制御ロボットでは、コンピューターが認識できる固定された方法で人間が「考える」必要がありました。たとえば、オペレーターの目の前には 2 本の光線があり、それぞれの光線はロボットの特定の作業タスクに関連しているため、機械に特定の作業を実行させるには、オペレーターはそのうちの 1 本を注視する必要があります。

このアプローチの欠点は、人間の思考活動のトレーニング プロセスとモデリングに非常に時間がかかり、労働集約的であることです。特に、ナビゲーションや建設作業を監督する人にとっては、これらのタスクに非常に集中した注意力が必要になるためです。

Rus 氏のチームは、プロセス全体をより自然なものにしたいと考えていました。この目標を達成するために、研究者らは、脳がエラーを認識するたびに生成されるエラー関連電位 (ErrP) と呼ばれる脳信号に注目しました。ロボットが選択しようとしていることを示した場合、システムは ErrP 信号を使用して、人間がマシンの決定に同意するかどうかを判断します。

「ロボットを見たら、その動作に心の中で同意するか、反対するかを判断するだけです」とラス氏は言う。「特定の考え方を身につける必要はありません。私たちの機械があなたに適応するのです。その逆ではありません。」

脳の ErrP 信号は非常に弱いため、システムを微調整して信号を分類し、フィードバック ループで人間のオペレーターと連携させる必要があります。 ErrP 信号の一次検出に加えて、研究チームは、システムが人間からのエラー訂正信号を認識していない場合のいわゆる「二次エラー」を検出することも機械に教えました。

「ロボットが自分の決定に自信がない場合は、より正確な答えを得るために人間のフィードバック機構を作動させることができます」とギル氏は言う。「こうした信号は、精度を向上させ、人間と機械が常にコミュニケーションを取りながら決定を下す対話プロセスを作り出すのに非常に効果的です。」 「

システムはまだ2番目のタイプの誤信号をリアルタイムで識別することはできませんが、それを識別できるようになればモデルの精度は90パーセント向上する可能性があるとギル氏は見積もっています。

また、ErrP 信号の強さはロボットのエラーの重大度を示すことがわかっているため、チームは将来のシステムをより複雑な複数選択タスクに拡張できると考えています。

サラザール=ゴメス氏は、このシステムは言葉でコミュニケーションできない人にも有効であると指摘する。スペルなどの作業は、一連の個別の二者択一で達成できる。サラザール=ゴメス氏はこれを、脳卒中患者のジャン=ドミニク・ボービー氏が回想録『Le Scaphandre et le Papillon』を執筆することを可能にした瞬きのメカニズムの高度なバージョンに例えている。

「この研究は、効果的な脳制御ロボットや人工装具の開発に一歩近づくものだ」と、この研究には関わっていないフライブルク大学のコンピューターサイエンス教授、ウォルフラム・バーガード氏は語った。「人間の言語を意味のある機械可読信号に翻訳することの難しさを考えると、この研究は人間とロボットの協働の将来に広範囲にわたる影響を与えるだろう。」

このプロジェクトはボーイング社と国立科学財団から一部資金提供を受けた。以下は原著論文の要約です。

論文タイトル: EEG信号を使用したロボットのミスのリアルタイム修正

概要: 人間の協力者の脳活動を通じてロボットとコミュニケーションをとることで、直接的で高速なフィードバック ループを実現できます。人間の協力者にとって、このコミュニケーション方法はシンプルで自然であり、直感に基づいてロボットと対話してさまざまなタスクを完了することも夢ではありません。この論文では、誤差関連ポテンシャル (ErrP) を閉ループ ロボット制御に適用する方法について説明します。 ErrP 信号は、予期しないエラーに反応して脳の活動から自然に発生するため、ロボットのタスクに特に役立ちます。我々は、人間のオペレーターが Rethink Robotics Baxter ロボットをリアルタイムで制御し、2 択タスクを実行しているときに ErrP 信号をデコードしました。また、この閉ループロボットタスク中に生成される潜在的なエラーに関連する二次的な相互作用信号を利用することで、分類タスクにおけるロボットのパフォーマンスを大幅に向上できることを示し、ロボットが人間からのフィードバックを得るための新しい手段を示唆しています。システム全体の設計と実装について詳しく説明し、リアルタイムのクローズドループおよびオープンループ制御の実験結果と、プライマリおよびセカンダリ ErrP 信号のオフライン分析を示します。実験課題を完了するために、一般集団の被験者を使用しましたが、これらの被験者は事前に訓練もスクリーニングも受けていませんでした。したがって、この研究は、シームレスなロボット制御を実現するための EGG ベースの回路アプローチの可能性を示しており、リアルタイムの直感的なインタラクションという目標に一歩近づきました。

図 1: 観察者の EEG 信号をリアルタイムでデコードすることで、ロボットは最初のアクションが間違っていたこと、そして適切なオブジェクト カテゴリに基づいて正しい選択を行うことを通知されます。

図 4: システムには、メインの実験コントローラ、Baxter ロボット、および EEG 取得および分類システムが含まれています。 Arduino システムは、コントローラーと EEG システムの間で情報を中継します。機械接続スイッチはロボットアームの動きの開始を検出します。

図 6: 単一の EEG データ バッファー内の ErrP を識別するためのさまざまな前処理および分類段階。この決定はロボットの動作に即座に影響し、それが EEG 信号に影響し、フィードバック ループが閉じます。

[この記事は、51CTOコラムニストのMachine Heart、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  Google、AIの地位強化のためデータサイエンスコミュニティKaggleの買収を発表

>>:  機械学習、データサイエンス、人工知能、ディープラーニング、統計の違いを理解する

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

AI は DevOps をどのように変えるのでしょうか?

DevOps は、コードの品質を損なうことなく、ソフトウェア開発プロセスを加速し、顧客に価値をより...

動的計算グラフとGPU対応操作

[[409431]]動的計算グラフディープラーニングに PyTorch を使用する主な理由の 1 つ...

ChatGPTがチップ設計に力強く参加します!専門的なハードウェア記述言語を学ぶ必要はなく、人間の言語を話すだけでよい

CPU 開発における大きな問題は、ChatGPT とのチャットで解決できるでしょうか?ニューヨーク州...

...

音声認識におけるCNNの応用

序文音声認識の現在の開発状況をまとめると、DNN、RNN/LSTM、CNN が音声認識における主流の...

テスラがテスラAIのTwitterアカウントを開設、Dojoスーパーコンピューターの生産を来月開始すると発表

テスラは6月22日、@Tesla AIというTwitterアカウントを作成し、「テスラは自律型ロボッ...

人工知能は200年以上前の進化のパズルをどうやって解くことができるのでしょうか?

人工知能は進化における最も古い謎の 1 つを解くのに役立っていますが、新たな謎ももたらしています。 ...

なぜ誰もディープラーニングの本質を明らかにしないのでしょうか? !

[[213484]]人類はゆっくりと世界の本質に近づいています。物質は単に情報パターンの担い手にす...

AIによって非効率と判断され、150人の労働者が解雇された。「労働者をコントロールできるのはまさに人工知能だ」

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AI のブラックボックスを開く: 「説明可能な」人工知能 (XAI) への認知ガイド!

今日、企業組織は意思決定に人工知能や機械学習モデルをますます頼りにしており、こうした意思決定は私たち...

金融業界における AI とビッグデータのトップ 10 トレンド

今日では、人々の仕事や生活のあらゆる側面がテクノロジーによって支援されています。人工知能はそのような...

CVPR 2017 論文の解釈: フィーチャーピラミッドネットワーク FPN

論文: 物体検出のための特徴ピラミッドネットワーク論文アドレス: https://arxiv.org...

AIを使ってアニメーションを作成する方法と、さまざまなツールがあなたを待っています

生成 AI は、インターネット上の重要なコンテンツ ソースとなっています。AI によって生成されたテ...

人工知能の本質的な「差別」を排除する方法

[[246531]]情報イラスト。出典:新華網ハリウッド映画「アベンジャーズ3」では、悪役サノスが「...

RAG か微調整か?マイクロソフトは特定分野における大規模モデルアプリケーションの構築プロセスガイドを公開した

大規模な言語モデル アプリケーションを構築するときに、独自のデータとドメイン固有のデータを組み込む一...