ボストン・ダイナミクスのロボット犬がチャットできるようになりました! ChatGPTは機知に富んだ会話をサポートします

ボストン・ダイナミクスのロボット犬がチャットできるようになりました! ChatGPTは機知に富んだ会話をサポートします

すごいですね、ボストン・ダイナミクスのロボット犬が直接話せるようになりました。

そして、Siriの「人工知能」とは異なり、ChatGPTを搭載した犬は、チャット中に非常に機知に富んだことができます。

たとえば、「喉が渇いた」と気軽に言ってみましょう。

コーヒーカウンターに直接案内され、次のような回答が得られます。

ここにはスナックバーとコーヒーマシンがあります。ここは、私たち人間の同僚がエネルギーの秘薬を探す場所です。ベースステーションのロボットと同じように、お気軽に水分補給やエネルギー補給を行ってください。

写真

その声はとても魅力的に聞こえます。

ボストン・ダイナミクスのショールームで、Spot V1 の親に会いに連れて行ってほしいと頼めば、Spot V1 を案内してくれることさえある。

写真

これらの機能の実装には特定のコードを記述する必要はありませんが、主に ChatGPT の「洞察力」とビジュアル質問応答 (VQA) モデル、Whisper などの AI モデルに依存して完了を支援します。

写真

これはネットユーザーを本当に驚かせた。

写真

おしゃべりロボット犬の作り方

具体的には、ボストン・ダイナミクスの研究者がロボット犬に提供したのは、単純なスクリプトだけだった。

提供される情報は主に、会社で利用可能な部屋や設備などです。各部屋と施設には、ロボットが充電する場所である「充電ステーション」など、対応する一文の説明があります。

写真

次に、Spot ロボット犬を歩き回らせ、カメラ自体を通して会社の環境を観察させ、VQA と ChatGPT の機能を使用して観察したオブジェクトに「ラベル」を付け、この情報をスクリプトに追加しました。

このような:

写真

このような訓練を終えると、ロボット犬の「ツアーガイド」は正式にその任務に就くことができるようになる。

観光客と冗談を言うことができます:

△「ロボット犬に遅れないように気をつけてくださいね」

彼はまた、真剣な科学的知識を広める能力にも優れています。

研究者らは、ロボット犬は「犬の設定」を自由に変更できるとも述べた。必要なのは、スクリプトに次のような文を追加することだけです。「あなたは 1920 年代の考古学者です。」

この「詩人」スポットのように、彼は次のような詩を作曲することができます。

発電機が陰鬱な部屋の中で低い音を立てた。私の魂と全く同じです。喜びのない部屋で発電機が低くブンブンと鳴る。まるで私の魂のように。

写真

さらに、Spot 3.3バージョンの動く物体を自動的に検出する機能に基づいて、ロボット犬の「ツアーガイド」は、最も近い人がどの方向にいるかを感知し、ロボットアームを回転させて「アイコンタクト」コミュニケーションを実現します。

研究者らは、生成された音声をローパスフィルターで処理し、それをロボットアームの動作軌跡に変換することで、ロボット犬の動きをより機敏にしました。

しかし、研究者らは、ChatGPTを搭載したロボット犬は時々意味不明なことを話すこともあるが、「ツアーガイド」としては大した問題ではないとも述べている。

彼らは次のように信じている。

私たちは、AI とロボット工学の交差点を探求し続けることに興奮しています。これら 2 つのテクノロジーは完璧にマッチします。

ロボットは、大型モデルを現実世界に「着陸」させる優れた方法を提供します。大規模モデルは多くのロボットタスクに役立ちます。たとえば、会話を通じてロボットにタスクを割り当てることができるため、ロボットを使用するハードルが下がります。

参考リンク: [1] https://www.youtube.com/watch?v=djzOBZUFzTw [2] https://bostondynamics.com/blog/robots-that-c​​an-chat/

<<:  クラウド上でのインテリジェント運転の 3D 再構築のベスト プラクティス

>>: 

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

RedditユーザーがAppleのCSAMツールをリバースエンジニアリングし、アルゴリズムがすでに存在していることを発見

[[418306]]今月初め、アップルはエコシステム全体に新たな子どもの安全機能を導入すると発表し...

AIインタラクションエクスペリエンスを向上させるにはどうすればよいでしょうか?まずこの三元理論を理解しましょう

概要:人工知能製品が徐々に人々の仕事、生活、娯楽に浸透し、あらゆる分野に革命的な変化をもたらすことは...

...

Huggingfaceによる大規模モデル進化ガイド:GPT-4を完全に再現する必要はない

ビッグデータダイジェスト制作ChatGPTが人気を博した後、AIコミュニティは「百式戦争」を開始しま...

高度な脅威検出における人工知能技術の応用

高度な持続的脅威は、その多様な形態、持続性、対立、隠蔽を特徴とし、現在、大手企業が脅威監視において直...

...

人工知能搭載の携帯電話は私たちの生活をどのように変えるのでしょうか? 携帯電話メーカーが何をしてきたか見てみましょう。

チャットができる「インテリジェント音声アシスタント」から、さまざまな家電を操作できるスマートスピーカ...

2030 年の汎用人工知能 (AGI) の見通しはどうなるでしょうか?

人工汎用知能 (AGI) とは、人間のような認知能力を備え、さまざまな領域にわたって理解、学習、タ...

...

ニューヨーク大学のチームは、自然言語を使ってチャットボットChatGPTを使ってマイクロプロセッサをゼロから設計した。

6月19日、生成型人工知能がハードウェア設計などの分野に参入し始めました。最近、ニューヨーク大学の...

人工知能の時代に教育はどのように適応すべきでしょうか?

これからの学びは、従来の学校中心の島型ではなく、新しいタイプの島型になります。家庭、インターネット、...

AIトレーニングの福音: 合成データについて

今日、AI テクノロジーは克服するのが難しいいくつかの主要な課題に直面しています。正確な結果を提供す...

人工知能は倫理的なジレンマに直面しており、将来の発展には法の支配が必要である

科学技術倫理とは、科学技術活動において遵守すべき価値観や行動規範であり、科学技術の発展にとって極めて...

ニューラルネットワークの層とノードの数を設定する方法

[51CTO.com クイック翻訳] 人工ニューラル ネットワークには、ネットワークのアーキテクチャ...