DeepMindがMuJoCoをオープンソース化！メタは「スケルトンハンド」にクルミをプレイさせるために使用されます

「クルミで遊んでいる」骸骨の手を見たことがありますか？

この魔法の「手」は、Meta が新たにリリースした AI プラットフォーム MyoSuite から生まれました。

うーん...私にはターミネーターの視覚感覚がある。

ザッカーバーグ：メタバースのアバターは救われる

伝統的な業界では、「一流企業は基準を設定し、二流企業はブランドを構築し、三流企業は製品を作る」という有名な格言があります。

この発言は少々絶対的ですが、業界標準の策定に参加する一流企業の多くは一流のブランドや製品を有していますが、この発言が主に強調しているのは、業界にとって「標準」がいかに重要であるかということです。

標準を管理する者は、ゲームのルールを設定する発言権を持ち、業界の「銀行家」になる可能性を秘めています。

AI時代には、テクノロジーの巨人たちも「標準」というビジネスの優位性を競っていますが、フレームワーク、プラットフォーム、ベンチマークなど、業界標準の意味を持つ新しい名前をたくさん変えてきました。

Metaも例外ではありません。

もちろん、ザッカーバーグがメタバースに全力を注ぎ、名前まで変えれば、すべてがメタバースに存在することになる。

ペンを回したり、キーを回したりするなど、複雑なアクションを実行するようにモデルをトレーニングできます。この研究は、義肢、身体リハビリテーション、外科手術技術の開発を加速させるだけでなく、メタバース用のよりリアルなアバターの開発にも役立つ可能性があります。私たちはこれらのモデルをオープンソース化し、研究者がそれらを使用してこの分野をさらに前進させることができるようにします。

まあ、下に示されているのは実際には「缶掴み」ではなくペン回しだとは予想していませんでした…

しかし、これは確かにちょっと厳しすぎます！

ああ、キーターナーもあります。（もう慣れたので文句は言えません）

話を戻しますが、このモデルはまだ初期段階のようですが、さまざまな細部のコントロールは非常に完璧です。

コントロールバーをスライドして親指を伸ばし、残りの 4 本の指を 1 本ずつ引っ込め、最後に腕を回転させます...

さあ、親指を立ててあげましょう！

さらに、研究がさらに進めば、Meta の「アバター」は、単なるかわいい漫画のイメージではなく、解剖学的に正確な一連の骨と動きを持つことができるようになるでしょう。

神経知能と運動知能の「大統合」

生物が賢ければ賢いほど、より複雑な運動行動を示すようになります。

したがって、検討すべき重要な質問は、このような複雑な意思決定とそれを実行する運動制御を可能にするものは何なのか、ということです。

Meta は、MyoSuite の開発はこの問題を探求することだと考えています。

論文アドレス: https://drive.google.com/file/d/10Le1OmOpy-Veb7n41ywrYLxyipoGfHtt/view

MyoSuite は、機械学習を使用して生体力学的制御問題を解決するための筋骨格モデルとタスクのスイートを提供します。

Meta 氏は、MyoSuite のもう 1 つの重要な意義は、運動知能と神経知能という知能の 2 つの側面を統合し、機械学習コミュニティ向けの包括的なベンチマークセットをオープンソース化していることだと述べました。

人間の生体力学は、複雑な多関節、多アクチュエータの筋骨格系です。筋肉の収縮には複数の関節の屈曲が伴い、各関節の動きは複数の筋肉によって制御されます。

このような複雑なシステムで知的な行動を統合し表現するには、数十億のニューロンのネットワークを通じて決定を統合する中枢神経系と、これらの意図を行動に変換する末梢筋骨格系の間の効果的な調整が必要です。

MyoSuite は、既存のモデルと機能研究の徹底的な研究を通じて開発されました。その研究開発の基盤は、現在、人間の神経機械制御、人間とコンピューターの相互作用、リハビリテーションの分野で広く使用されている腕と手の OpenSim モデルです。

これらのモデルを MuJoCo に実装するために、研究者は、骨格と筋肉の付着部の幾何学的変換、腕のトルクの最適化、筋力の最適化のための新しいモデルを開発するためのパイプラインを開発しました。

MyoSuite は、テスト用に生理学的に正確な筋骨格モデルのポートフォリオをいくつか提供しています。モデルの構築は、次の 3 つのステップに分けられます。

1. ジオメトリ変換。これには、関節の形状、筋肉の付着点、ラッピングサーフェスの変換が含まれます。このステップは以前の作業に基づいています。

2. パワーアームの最適化。 MuJoCo でラップされた面の 3D 位置を最適化します。参照 OpenSim モデルと一致するモーメントアームを実現するための MuJoCo でのラッピングサーフェスの 3D 位置。

3. 筋力の最適化: MuJoCo の筋肉パラメータを最適化して、制御 OpenSim モデルに一致する筋力を実現します。厳密なモデリングと検証を経て、最終的に複雑さのレベルの異なる 3 つのモデルが確立されました。

MyoSuite に含まれる筋骨格モデル。 A: MyoFinger (4 つの関節、5 つの筋肉)、B: MyoElbow: (1 つの関節、6 つの筋肉)。 C: MyoHand（関節数23、筋肉数39）。

指 (MyoFinger): まず、一連の単純化された 5 つの拮抗筋腱ユニットによって駆動される、単純化された直感的なモデル、つまり 4 自由度 (DoF) の指 (MyoFinger、上図 A) を構築します。研究チームは比較研究を容易にするために、シンプルなトルクドライブを提供しました。

肘 (MyoElbow): OpenSim のデフォルト設定に基づいて腕モデルをテストし、複数の主動筋/拮抗筋ペア (3 つの屈筋と 3 つの伸筋) を使用して駆動する、人間の肘関節の 1 DOF モデルです (上図 B)。

手 (MyoHand): 実際には前腕、手首、手が含まれます。人間の手の器用さには、さまざまな関節に補完的および拮抗的な影響を及ぼす複数の高度に冗長な筋肉の協調が必要です。このより複雑な筋骨格モデルは、29 個の骨、23 個の関節、および 39 個の筋腱ユニットで構成されています (図 C)。

人工知能の分野では長年にわたり、神経構造、つまりニューラルネットワークを通じて知的な行動を模倣しようと試みられてきました。バイオメカニクスのコミュニティでは、筋骨格系は、末梢駆動力を理解するために、主に生体内および生体外の研究を通じて独自に開発されてきました。

MyoSuite により、研究者は、豊富なインタラクティブ環境でインテリジェントな動作を発揮するために必要な、さまざまな固有受容信号を利用して体全体の運動制御を調整し、感覚運動制御の詳細をさらに進歩させることが期待されます。

MyoSuite の生理学的にリアルな筋骨格モデルは、既存のモデルに比べて計算効率と拡張性が 4,000 倍優れています。

このような強力なリソースとコンピューティング効率のサポートがあれば、片手でペンを回したり、鍵を回したり、クルミを回したりすることも当然問題ありません。

さらに、これらの「派手なトリック」は、MyoSuite が「何ができるか」、そして将来「何ができるか」を伝えるためのものです。Meta 氏はまた、主にスポーツリハビリテーション、義肢開発、人間工学的応用になると述べました。

将来の義肢は、オリジナルのものよりも優れたものになるでしょうか?

MuJoCo オープンソース

AlphaGoからMuZeroまで、機械学習アルゴリズムはこれまで多くの複雑な問題を解決してきましたが、複雑な動作制御の分野では広く使用されていません。Meta氏は、主な理由は複雑な外部環境と対話する能力が不足していることだと考えています。

言い換えれば、既存のフレームワークには、複雑で熟練した運動タスクが組み込まれておらず、機械学習アルゴリズムのデータ要求を満たすのに十分な計算効率や拡張性もありません。

Meta 氏は、MyoSuite がそれらのギャップを埋めることを約束していると述べています。

現在、MyoSuite は MuJoCo v2.1.0 を使用して MacOs および Linux でテストされています。

偶然にも、DeepMind も同日に MuJoCo をオープンソース化しました。

プロジェクトアドレス: https://github.com/deepmind/mujoco

MuJoCoはもともとワシントン大学の神経科学者で運動制御研究所所長のエモ・トドロフ氏によって開発され、2015年にスタートアップ企業Robi LLCを通じて商品化された。

2021年10月、DeepMindはMuJoCo物理シミュレーターの買収を発表し、MuJoCoを無料のオープンソースのコミュニティ主導プロジェクトとして開発および維持することを約束しました。

物理シミュレーターは、現在のロボット研究にとって重要なツールです。一般的には、商用のクローズドソースソフトウェアと学術的なオープンソースソフトウェアに分けられます。

最初のカテゴリはユーザーにとって不透明であり、自由に使用できる場合もありますが、変更できず、理解しにくいものです。 2 番目のカテゴリは通常、ユーザーベースが小さく、開発者や保守担当者が卒業すると問題が発生します。

MuJoCo は、定評のある企業がサポートする、真のオープンソースである数少ないフル機能のシミュレーターの 1 つです。

研究主導型の組織である DeepMind は、MuJoCo を、ロボット工学者やエンジニアが世界最高のロボットシミュレーターの開発に参加できる共同プラットフォームであると考えています。

現在、DeepMindのオープンソース作業は完了しており、MuJoCoのコードベース全体がGitHubにアップロードされています。

<<: 深い知識の 6 つの次元: 人工知能に世界を真に理解させるにはどうすればよいでしょうか?

>>: Googleが絵画におけるAI使用の権利を取り戻す、ネットユーザー「DALL・E 2は発売からわずか1ヶ月で時代遅れ？」

ブログ

未来が到来: 脳コンピューターインターフェースの新たなブレークスルー: 人間の脳信号をテキストに変換する精度は 97%

ブログ

DeepMindがMuJoCoをオープンソース化！メタは「スケルトンハンド」にクルミをプレイさせるために使用されます

ザッカーバーグ：メタバースのアバターは救われる

神経知能と運動知能の「大統合」

MuJoCo オープンソース

インテリジェント運転ビッグデータの最先端の研究の進歩と典型的な応用

スマートサーマルイメージングカメラは屋外セキュリティソリューションの第一選択肢となる

ジャック・マーがまた一人の世界クラスの科学者を採用しました。春節期間中に電車の切符を買うときにシステムクラッシュを心配する必要はもうありません!

AIと宇宙技術が日常生活をどう改善するか

ちょっとした会話の後に心を開いてみませんか?この世代の人工知能はあなたのプライバシーを会話の話題に変えました

重要インフラのサイバーセキュリティリスク管理における AI の影響

信頼できる機械学習モデルを作成するにはどうすればよいでしょうか?まず不確実性を理解する

未来が到来: 脳コンピューターインターフェースの新たなブレークスルー: 人間の脳信号をテキストに変換する精度は 97%

推薦する

C# データ構造とアルゴリズムのシーケンステーブルの簡単な分析

顔認識は終わったのか？最初の「顔ハイジャック」型バンキングトロイの木馬が誕生

マッキンゼーのレポート: 2030 年までに 8 億人が機械に置き換えられ、約 1 億人の中国人が転職を余儀なくされる!

10億ピクセル画像のマルチスケール特性評価のためのスタンフォード大学の新しいニューラルシーン表現方法がSIGGRAPHに選出されました

清華大学の卒業生とMITの中国人博士課程の学生がソルバーと組み合わせ、自動運転の安全性を向上させる初の認識アルゴリズムセットを開発した。

AIをベースとしたイベントインテリジェント分析システム構築の実践

孫正義：今後30年の人工知能とモノのインターネット

ハッシュアルゴリズムに基づくMySQLテーブルパーティション

AI研究も印象派から学べるのでしょうか？これらの生きているような人物は3Dモデルであることが判明した

顔を自由に編集！ Adobe が新世代の GAN アーティファクトを発表: 最大 35 の顔属性の変更をサポート

「インターネット情報サービスアルゴリズム推奨管理規則」が公布され、3月1日に発効される。

AI人材の競争は軍拡競争となっている。AIの創造性競争に賭けるAI大手の中で、勝利のポイントを獲得するのはどれだろうか？

AIが生成した写真は奇妙すぎますか?メリーランド大学とニューヨーク大学が共同でニューラルネットワークを解析、CLIPモデルのニューロンは頭蓋骨に似ている