テンセントのロボット犬が本物の犬の仕事を奪う!彼は楽しくゲームをしたり、歩き回ったりすることができます。

テンセントのロボット犬が本物の犬の仕事を奪う!彼は楽しくゲームをしたり、歩き回ったりすることができます。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

ロボット犬に本物の犬の動作データを学習させたら、本当にハスキー犬みたいになりました!

ハードルを簡単に飛び越えてしまい、後ろにいる「飼い主」はほとんど追いつけない状態でした。

「犬用の穴」を掘るのは簡単です。

2匹の犬は、一方が追いかけ、もう一方が逃げるなど、一緒に楽しく遊ぶことができます。

これはテンセントのロボット犬の最新の進歩です。

事前トレーニング済みのモデルを使用してロボット犬に実際の犬の動作データを入力することで、強化学習を通じて、ロボット犬マックスはより機敏な行動をとるだけでなく、すでに習得したスキルに基づいて「推論」し、より複雑な環境に適応することもできます。

まとめると、内側も外側も「さらに犬らしく」なりました。

戦略的に楽しみを追求する

今回ロボット犬が習得した新しいスキルの中で最も強力なのは、ゲームをすることだ。

ロボット犬はルールに従うだけでなく、ゲームに勝つための独自の戦略を考え出すこともできるため、本物の犬よりも賢いかもしれません。

具体的には、「ワールドチェイスタグ」にヒントを得た障害物競走で、ルールは以下のとおりです。

研究者たちはさまざまなゲームの難易度を設定しましたが、最も単純なのはオープンフィールドです。

ゲーム中、ロボット犬が戦略的であることは明らかでした。

たとえば、追跡者は通常、逃亡者がチェスの旗から遠く離れて追い詰められ、ゲームが終了したときにのみ激しい攻撃を開始します。

追跡者は、逃亡者が旗に非常に近く、追いつく見込みがないことがわかった場合、追跡を諦めて次の旗が現れるのを待ちます。

障害物があっても、2匹の犬はとても楽しんでいます。

ロボット犬がこのようなパフォーマンスをできるのは、最初からこのゲームで訓練されていたからではありません。

これは実際には、このゲーム シナリオに対処するためにすでに学習したいくつかのアクション、知識、スキルに基づいています。

具体的にどうやって達成するのでしょうか?下を見てください。

実際の犬のデータを学習

研究は3つの段階に分かれています。

  • 動物の動きを学ぶ
  • 動きのジェスチャーを外部の知覚にリンクする
  • ネットワーク取得と複雑なタスクに関する追加情報

第一段階では、ゲームで一般的に使用されるモーションキャプチャシステムを通じて、歩く、走る、ジャンプする、立つなどの動きを含む実際の犬の姿勢データを収集し、シミュレーター内で模倣学習タスクを構築します。

これらのデータに含まれる情報は抽象化され、ディープニューラルネットワークモデルに圧縮されるため、動作姿勢情報だけでなく、ある程度の解釈可能性もカバーされます。

Tencent RoboticsX Robotics LaboratoryとTencent Gamesは協力して、ゲーム技術を使用してシミュレーションエンジンの精度と効率を向上させるとともに、ゲームの制作と開発中に多様なモーションキャプチャ素材を蓄積してきました。

これらのテクノロジーとデータは、物理シミュレーションに基づくインテリジェントエージェントのトレーニングや現実世界のロボット戦略の展開においても、一定の補助的な役割を果たします。

模倣学習プロセス中、ニューラル ネットワークは、ロボットのモーターの状態など、ロボット犬の固有受容感覚情報のみを入力として受け入れます。

次のステップでは、モデルは、他のセンサーによって「見える」足元の障害物など、周囲の環境の知覚データを導入します。

第 2 段階では、第 1 段階で学習された動物の姿勢が、追加のネットワーク パラメータを通じて外部知覚にリンクされます。

このようにして、ロボット犬は学習した動作を通じて外部環境に反応することができます。

ロボットがさまざまな複雑な環境に適応できるようになると、動物の姿勢と外部の知覚を結び付ける知識が固められ、ニューラル ネットワーク構造に保存されます。

するとロボット犬は自由に階段を登れるようになります。

または、不連続で不均一な地面を走る場合:

そして最終段階では、ロボット犬は学習したスキルに基づいて実用的な問題を解決するよう求められます。

これは上で述べたゲームセッションです。

ゲーム内のロボット犬の制御戦略はすべてニューラルネットワーク戦略であると報告されています。

ニューラル ネットワークは、シミュレーションとゼロ ショット転送を通じて学習し、人間の推論をシミュレートして、これまで見たことのない新しいものを認識し、この知識を実際のロボットに展開することができます。

たとえば、ロボット犬が事前トレーニング モデルで障害物を回避することを学習していれば、ゲームで設定された障害物にも簡単に対処できます。

新たな研究の進歩は、Tencent Robotics X Robotics Laboratoryによってもたらされました。

この実験は2018年に設立され、現在立ち上げられているロボットプロジェクトには、第1世代/第2世代のロボット犬Max、ロボット犬Jamoca、車輪付きロボットOllie、セルフバランス自動運転バイクなどが含まれます。

もう一つ

カリフォルニア大学バークレー校の学者たちが以前、ロボット犬に「本物の犬」の訓練方法を使ったことがあることは特筆に値します。

アンドリュー・ン氏の最初の弟子であるピーター・アビール氏らは、ロボット犬を1時間地面で転がらせ、歩くことを学習させた。

テンセントが昨年、ロボット犬マックスの第2世代をリリースした際、短い動画で犬が「足​​を跳ねたり」「楽しそうに走ったり」する様子が紹介され、本当に家にいる毛むくじゃらの子供のように見えた。

(もちろん、飼い主の言うことを聞く犬にしたいのであれば、コマンドで命令することもできます。)

私たちが言いたいのは、ロボット犬の現在の開発方向は宙返りではなく、本物の犬から「仕事を奪う」ことにあるということでしょうか?

<<:  このスタートアップは、アイドル状態のGPUを分散ネットワークに接続することで、AIモデルのトレーニングコストを90%削減できると主張している。

>>:  スマートカーのステアバイワイヤ技術の詳細な説明

ブログ    
ブログ    

推薦する

分散型コンセンサスアルゴリズム: 想像以上に複雑

1. 分散システムの難しさ張大鵬は難しい問題に遭遇した。彼らの会社には貴重なデータを保存しているサー...

...

ガートナー、2023年の中国のデータ分析と人工知能技術の成熟度曲線を発表

ガートナーは、2026年までに中国のホワイトカラー職の30%以上が再定義され、生成AIを活用し管理す...

タオ氏の新しい論文:有名な素数予想を部分的に証明、新しい方法は彼の古いモデルを使用する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

スマートホームのヒューマンマシンインターフェース (HMI) におけるエッジ AI

消費者は、利便性、安全性、ユーザーエクスペリエンスを向上させる進歩を飽くなき欲求で求めています。ヒュ...

AI のゴッドファーザーであるヒントンは、なぜ自らが作り出した人工知能を恐れているのでしょうか?

ジェフリー・ヒントンは、コンピューターに学習方法を教えることに生涯を費やしてきました。今、彼は人工脳...

人間は AI シミュレーションの中で生きられるのか?

人々が自らに問うべき実存的な問いは、自分たちがシミュレートされた宇宙に住んでいるかどうかだ。 [[3...

インテリジェントビル通信システムの構成と要件

1. インテリジェントビル通信システムの構成インテリジェントビル通信システムは、主に以下の部分で構成...

人工知能があなたの仕事を奪い、ビッグデータがあなたを「裸」にしてしまう。私たちの未来はどうなるのでしょうか?

失業率が急上昇、それはAIのせいか? !科学技術の発展に伴い、高コストで非効率的な手作業が人工知能に...

Linux サーバー管理のヒント: 効率とセキュリティを向上させる

Linux サーバー管理は、サーバーの安全、安定、効率的な運用を確保するための重要なタスクです。以下...

2022年スタンフォードAIインデックス発表:中国がAIジャーナルの出版と引用で1位、TFオープンソースライブラリが最も人気

人工知能の分野では、スタンフォード大学が開始したAIインデックスは、AIの動向と進歩を追跡する非営利...

...

ディープラーニングモデルを使用して Java でテキスト感情分析を実行する

肯定的ですか? 否定的ですか? 中立的ですか? Stanford CoreNLP コンポーネントと数...

現在、CIOは企業におけるGenAIの応用価値を慎重に検討している。

ほとんどの CIO は、自社のビジネスがテクノロジーのトレンドに追いつくために GenAI の検討を...