ボストン・ダイナミクスのロボット犬がチャットできるようになりました! ChatGPTは機知に富んだ会話をサポートします

ボストン・ダイナミクスのロボット犬がチャットできるようになりました! ChatGPTは機知に富んだ会話をサポートします

すごいですね、ボストン・ダイナミクスのロボット犬が直接話せるようになりました。

そして、Siriの「人工知能」とは異なり、ChatGPTを搭載した犬は、チャット中に非常に機知に富んだことができます。

たとえば、「喉が渇いた」と気軽に言ってみましょう。

コーヒーカウンターに直接案内され、次のような回答が得られます。

ここにはスナックバーとコーヒーマシンがあります。ここは、私たち人間の同僚がエネルギーの秘薬を探す場所です。ベースステーションのロボットと同じように、お気軽に水分補給やエネルギー補給を行ってください。

写真

その声はとても魅力的に聞こえます。

ボストン・ダイナミクスのショールームで、Spot V1 の親に会いに連れて行ってほしいと頼めば、Spot V1 を案内してくれることさえある。

写真

これらの機能の実装には特定のコードを記述する必要はありませんが、主に ChatGPT の「洞察力」とビジュアル質問応答 (VQA) モデル、Whisper などの AI モデルに依存して完了を支援します。

写真

これはネットユーザーを本当に驚かせた。

写真

おしゃべりロボット犬の作り方

具体的には、ボストン・ダイナミクスの研究者がロボット犬に提供したのは、単純なスクリプトだけだった。

提供される情報は主に、会社で利用可能な部屋や設備などです。各部屋と施設には、ロボットが充電する場所である「充電ステーション」など、対応する一文の説明があります。

写真

次に、Spot ロボット犬を歩き回らせ、カメラ自体を通して会社の環境を観察させ、VQA と ChatGPT の機能を使用して観察したオブジェクトに「ラベル」を付け、この情報をスクリプトに追加しました。

このような:

写真

このような訓練を終えると、ロボット犬の「ツアーガイド」は正式にその任務に就くことができるようになる。

観光客と冗談を言うことができます:

△「ロボット犬に遅れないように気をつけてくださいね」

彼はまた、真剣な科学的知識を広める能力にも優れています。

研究者らは、ロボット犬は「犬の設定」を自由に変更できるとも述べた。必要なのは、スクリプトに次のような文を追加することだけです。「あなたは 1920 年代の考古学者です。」

この「詩人」スポットのように、彼は次のような詩を作曲することができます。

発電機が陰鬱な部屋の中で低い音を立てた。私の魂と全く同じです。喜びのない部屋で発電機が低くブンブンと鳴る。まるで私の魂のように。

写真

さらに、Spot 3.3バージョンの動く物体を自動的に検出する機能に基づいて、ロボット犬の「ツアーガイド」は、最も近い人がどの方向にいるかを感知し、ロボットアームを回転させて「アイコンタクト」コミュニケーションを実現します。

研究者らは、生成された音声をローパスフィルターで処理し、それをロボットアームの動作軌跡に変換することで、ロボット犬の動きをより機敏にしました。

しかし、研究者らは、ChatGPTを搭載したロボット犬は時々意味不明なことを話すこともあるが、「ツアーガイド」としては大した問題ではないとも述べている。

彼らは次のように信じている。

私たちは、AI とロボット工学の交差点を探求し続けることに興奮しています。これら 2 つのテクノロジーは完璧にマッチします。

ロボットは、大型モデルを現実世界に「着陸」させる優れた方法を提供します。大規模モデルは多くのロボットタスクに役立ちます。たとえば、会話を通じてロボットにタスクを割り当てることができるため、ロボットを使用するハードルが下がります。

参考リンク: [1] https://www.youtube.com/watch?v=djzOBZUFzTw [2] https://bostondynamics.com/blog/robots-that-c​​an-chat/

<<:  クラウド上でのインテリジェント運転の 3D 再構築のベスト プラクティス

>>: 

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Scikit-Learn を使用して、MNIST データセットを分類するための K 近傍法アルゴリズムを構築する

K 最近傍アルゴリズム、K-NN とも呼ばれます。今日のディープラーニングの時代では、この古典的な機...

...

2022年に注目すべき5つのAI活用法

AI インフラストラクチャの継続的な革新と開発により、今日の仕事のやり方は変化しました。人工知能は...

人工知能はよりクールで実用的

2021年は間違いなく人工知能産業の発展にとって重要な年となるでしょう。わが国のスマートシティ建設の...

Llama2がオープンソース化された後、国内の大型モデルはどのような展開を見せるのでしょうか?

7 月 19 日、オープン ソース コミュニティの最も強力な大規模モデルが Llama から Ll...

...

3つの主要な要因の影響を受けて、自動運転トラックの開発は加速し続けています

近年、自動運転は幅広い注目を集め、熱い議論を呼んでいます。自動運転は自動車産業の将来のトレンドである...

MIT が夢を創るマシン「ドリーム インキュベーター」を開発、インセプションの現実版をカスタマイズ

目が覚めているのと眠っているのを同時に経験したことがありますか?実はここは現実と夢を繋ぐ中継駅なので...

完全なグラフが利用できない場合にグラフディープラーニングを使用するにはどうすればよいでしょうか?

多様体学習は、2000 年に有名な科学雑誌 Science で初めて提案されて以来、情報科学の分野に...

大規模言語モデルとAIコードジェネレータの台頭

翻訳者 |李睿レビュー | Chonglouこの記事の著者であるMartin Heller は、 W...

...

メディア業界の自動化をリードする10のAI分野

データ爆発の時代では、データの収集だけでは不十分です。ビジネスを運営し、成長させるための洞察を得るに...

人間は強力な人工知能の開発を心配する必要はない

[51CTO.com クイック翻訳] 現在、人工知能技術が「悪のロボット」に発展し、世界を支配するの...

AIがイノベーションの大きな原動力となる理由

近年、人工知能は新興技術から必需品へと徐々に変化してきました。より大規模な企業の問題に対する解決策を...