DeepMindがMuJoCoをオープンソース化!メタは「スケルトンハンド」にクルミをプレイさせるために使用されます

DeepMindがMuJoCoをオープンソース化!メタは「スケルトンハンド」にクルミをプレイさせるために使用されます

「クルミで遊んでいる」骸骨の手を見たことがありますか?

この魔法の「手」は、Meta が新たにリリースした AI プラットフォーム MyoSuite から生まれました。

うーん...私にはターミネーターの視覚感覚がある。

ザッカーバーグ:メタバースのアバターは救われる

伝統的な業界では、「一流企業は基準を設定し、二流企業はブランドを構築し、三流企業は製品を作る」という有名な格言があります。

この発言は少々絶対的ですが、業界標準の策定に参加する一流企業の多くは一流のブランドや製品を有していますが、この発言が主に強調しているのは、業界にとって「標準」がいかに重要であるかということです。

標準を管理する者は、ゲームのルールを設定する発言権を持ち、業界の「銀行家」になる可能性を秘めています。

AI時代には、テクノロジーの巨人たちも「標準」というビジネスの優位性を競っていますが、フレームワーク、プラットフォーム、ベンチマークなど、業界標準の意味を持つ新しい名前をたくさん変えてきました。

Metaも例外ではありません。

もちろん、ザッカーバーグがメタバースに全力を注ぎ、名前まで変えれば、すべてがメタバースに存在することになる。

ペンを回したり、キーを回したりするなど、複雑なアクションを実行するようにモデルをトレーニングできます。この研究は、義肢、身体リハビリテーション、外科手術技術の開発を加速させるだけでなく、メタバース用のよりリアルなアバターの開発にも役立つ可能性があります。私たちはこれらのモデルをオープンソース化し、研究者がそれらを使用してこの分野をさらに前進させることができるようにします。

まあ、下に示されているのは実際には「缶掴み」ではなくペン回しだとは予想していませんでした…

しかし、これは確かにちょっと厳しすぎます!

ああ、キーターナーもあります。 (もう慣れたので文句は言えません)

話を戻しますが、このモデルはまだ初期段階のようですが、さまざまな細部のコントロールは非常に完璧です。

コントロール バーをスライドして親指を伸ばし、残りの 4 本の指を 1 本ずつ引っ込め、最後に腕を回転させます...

さあ、親指を立ててあげましょう!

さらに、研究がさらに進めば、Meta の「アバター」は、単なるかわいい漫画のイメージではなく、解剖学的に正確な一連の骨と動きを持つことができるようになるでしょう。

神経知能と運動知能の「大統合」

生物が賢ければ賢いほど、より複雑な運動行動を示すようになります。

したがって、検討すべき重要な質問は、このような複雑な意思決定とそれを実行する運動制御を可能にするものは何なのか、ということです。

Meta は、MyoSuite の開発はこの問題を探求することだと考えています。

論文アドレス: https://drive.google.com/file/d/10Le1OmOpy-Veb7n41ywrYLxyipoGfHtt/view

MyoSuite は、機械学習を使用して生体力学的制御問題を解決するための筋骨格モデルとタスクのスイートを提供します。

Meta 氏は、MyoSuite のもう 1 つの重要な意義は、運動知能と神経知能という知能の 2 つの側面を統合し、機械学習コミュニティ向けの包括的なベンチマーク セットをオープンソース化していることだと述べました。

人間の生体力学は、複雑な多関節、多アクチュエータの筋骨格系です。筋肉の収縮には複数の関節の屈曲が伴い、各関節の動きは複数の筋肉によって制御されます。

このような複雑なシステムで知的な行動を統合し表現するには、数十億のニューロンのネットワークを通じて決定を統合する中枢神経系と、これらの意図を行動に変換する末梢筋骨格系の間の効果的な調整が必要です。

MyoSuite は、既存のモデルと機能研究の徹底的な研究を通じて開発されました。その研究開発の基盤は、現在、人間の神経機械制御、人間とコンピューターの相互作用、リハビリテーションの分野で広く使用されている腕と手の OpenSim モデルです。

これらのモデルを MuJoCo に実装するために、研究者は、骨格と筋肉の付着部の幾何学的変換、腕のトルクの最適化、筋力の最適化のための新しいモデルを開発するためのパイプラインを開発しました。

MyoSuite は、テスト用に生理学的に正確な筋骨格モデルのポートフォリオをいくつか提供しています。モデルの構築は、次の 3 つのステップに分けられます。

1. ジオメトリ変換。これには、関節の形状、筋肉の付着点、ラッピング サーフェスの変換が含まれます。このステップは以前の作業に基づいています。

2. パワーアームの最適化。 MuJoCo でラップされた面の 3D 位置を最適化します。参照 OpenSim モデルと一致するモーメント アームを実現するための MuJoCo でのラッピング サーフェスの 3D 位置。

3. 筋力の最適化: MuJoCo の筋肉パラメータを最適化して、制御 OpenSim モデルに一致する筋力を実現します。厳密なモデリングと検証を経て、最終的に複雑さのレベルの異なる 3 つのモデルが確立されました。

MyoSuite に含まれる筋骨格モデル。 A: MyoFinger (4 つの関節、5 つの筋肉)、B: MyoElbow: (1 つの関節、6 つの筋肉)。 C: MyoHand(関節数23、筋肉数39)。

指 (MyoFinger): まず、一連の単純化された 5 つの拮抗筋腱ユニットによって駆動される、単純化された直感的なモデル、つまり 4 自由度 (DoF) の指 (MyoFinger、上図 A) を構築します。研究チームは比較研究を容易にするために、シンプルなトルクドライブを提供しました。

肘 (MyoElbow): OpenSim のデフォルト設定に基づいて腕モデルをテストし、複数の主動筋/拮抗筋ペア (3 つの屈筋と 3 つの伸筋) を使用して駆動する、人間の肘関節の 1 DOF モデルです (上図 B)。

手 (MyoHand): 実際には前腕、手首、手が含まれます。人間の手の器用さには、さまざまな関節に補完的および拮抗的な影響を及ぼす複数の高度に冗長な筋肉の協調が必要です。このより複雑な筋骨格モデルは、29 個の骨、23 個の関節、および 39 個の筋腱ユニットで構成されています (図 C)。

人工知能の分野では長年にわたり、神経構造、つまりニューラル ネットワークを通じて知的な行動を模倣しようと試みられてきました。バイオメカニクスのコミュニティでは、筋骨格系は、末梢駆動力を理解するために、主に生体内および生体外の研究を通じて独自に開発されてきました。

MyoSuite により、研究者は、豊富なインタラクティブ環境でインテリジェントな動作を発揮するために必要な、さまざまな固有受容信号を利用して体全体の運動制御を調整し、感覚運動制御の詳細をさらに進歩させることが期待されます。

MyoSuite の生理学的にリアルな筋骨格モデルは、既存のモデルに比べて計算効率と拡張性が 4,000 倍優れています。

このような強力なリソースとコンピューティング効率のサポートがあれば、片手でペンを回したり、鍵を回したり、クルミを回したりすることも当然問題ありません。

さらに、これらの「派手なトリック」は、MyoSuite が「何ができるか」、そして将来「何ができるか」を伝えるためのものです。Meta 氏はまた、主にスポーツリハビリテーション、義肢開発、人間工学的応用になると述べました。

将来の義肢は、オリジナルのものよりも優れたものになるでしょうか?

MuJoCo オープンソース

AlphaGoからMuZeroまで、機械学習アルゴリズムはこれまで多くの複雑な問題を解決してきましたが、複雑な動作制御の分野では広く使用されていません。Meta氏は、主な理由は複雑な外部環境と対話する能力が不足していることだと考えています。

言い換えれば、既存のフレームワークには、複雑で熟練した運動タスクが組み込まれておらず、機械学習アルゴリズムのデータ要求を満たすのに十分な計算効率や拡張性もありません。

Meta 氏は、MyoSuite がそれらのギャップを埋めることを約束していると述べています。

現在、MyoSuite は MuJoCo v2.1.0 を使用して MacOs および Linux でテストされています。

偶然にも、DeepMind も同日に MuJoCo をオープンソース化しました。

プロジェクトアドレス: https://github.com/deepmind/mujoco

MuJoCoはもともとワシントン大学の神経科学者で運動制御研究所所長のエモ・トドロフ氏によって開発され、2015年にスタートアップ企業Robi LLCを通じて商品化された。

2021年10月、DeepMindはMuJoCo物理シミュレーターの買収を発表し、MuJoCoを無料のオープンソースのコミュニティ主導プロジェクトとして開発および維持することを約束しました。

物理シミュレーターは、現在のロボット研究にとって重要なツールです。一般的には、商用のクローズドソース ソフトウェアと学術的なオープン ソース ソフトウェアに分けられます。

最初のカテゴリはユーザーにとって不透明であり、自由に使用できる場合もありますが、変更できず、理解しにくいものです。 2 番目のカテゴリは通常、ユーザー ベースが小さく、開発者や保守担当者が卒業すると問題が発生します。

MuJoCo は、定評のある企業がサポートする、真のオープンソースである数少ないフル機能のシミュレーターの 1 つです。

研究主導型の組織である DeepMind は、MuJoCo を、ロボット工学者やエンジニアが世界最高のロボット シミュレーターの開発に参加できる共同プラットフォームであると考えています。

現在、DeepMindのオープンソース作業は完了しており、MuJoCoのコードベース全体がGitHubにアップロードされています。

<<:  深い知識の 6 つの次元: 人工知能に世界を真に理解させるにはどうすればよいでしょうか?

>>:  Googleが絵画におけるAI使用の権利を取り戻す、ネットユーザー「DALL・E 2は発売からわずか1ヶ月で時代遅れ?」

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ついに、人工知能の3つの重要な機能を説明する人がいた。

人間の知性は広大かつ複雑です。人間の成果の中には、今日の機械では到底達成できないものもあり、機械がこ...

...

...

2021年の中国AI業界の10大トレンド、1分でわかる | WAIC2021

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

【ビッグネーム登場、第2話】快溝タクシーの知能進化への道

インテリジェントな注文発送システムをゼロから構築するように依頼され、1 日の注文数が 40 万件だと...

AIはイノベーションを通じて気候への影響を補うことができるでしょうか?

最も熱心な気候変動監視者でさえ希望を抱いている。なぜなら、人類の革新と技術が私たちをこの混乱に陥れた...

完全にプログラム可能な初の光量子コンピュータが発表されました。最強のスーパーコンピュータ「富岳」の7.8兆倍の性能です。

スーパーコンピュータは、従来のコンピュータでは解決できない問題を解決するためによく使用されます。しか...

アルゴリズム問題演習 - 大規模ブラックリスト IP マッチング

多くの IT 企業では、アルゴリズムは面接で非常に重要な部分を占めていますが、実際の仕事でアルゴリズ...

企業がビジネスで人工知能をどのように活用しているか

ビジネスにおける人工知能 (AI) は、今日の企業にとって急速に一般的な競争ツールになりつつあります...

GoogleのReCaptchaシステムが破られ、機械音声認証の精度は85%に達した

米国のメリーランド大学の研究者4人が、GoogleのキャプチャシステムReCaptchaを解読できる...

...

OpenAIの従業員が996の勤務スケジュールを公開、ネットユーザー「本当の競争は強制する必要はない」

OpenAI も 996 で動作することが確認されています (doge)。 『Thinking C...

運営:申し訳ありませんが、当社は責任を負いかねます

[51CTO.com より引用] 運用保守というと、多くの人が無意識のうちに運用保守担当者を「スケー...