DeepMindがMuJoCoをオープンソース化！メタは「スケルトンハンド」にクルミをプレイさせるために使用されます

「クルミで遊んでいる」骸骨の手を見たことがありますか？

この魔法の「手」は、Meta が新たにリリースした AI プラットフォーム MyoSuite から生まれました。

うーん...私にはターミネーターの視覚感覚がある。

ザッカーバーグ：メタバースのアバターは救われる

伝統的な業界では、「一流企業は基準を設定し、二流企業はブランドを構築し、三流企業は製品を作る」という有名な格言があります。

この発言は少々絶対的ですが、業界標準の策定に参加する一流企業の多くは一流のブランドや製品を有していますが、この発言が主に強調しているのは、業界にとって「標準」がいかに重要であるかということです。

標準を管理する者は、ゲームのルールを設定する発言権を持ち、業界の「銀行家」になる可能性を秘めています。

AI時代には、テクノロジーの巨人たちも「標準」というビジネスの優位性を競っていますが、フレームワーク、プラットフォーム、ベンチマークなど、業界標準の意味を持つ新しい名前をたくさん変えてきました。

Metaも例外ではありません。

もちろん、ザッカーバーグがメタバースに全力を注ぎ、名前まで変えれば、すべてがメタバースに存在することになる。

ペンを回したり、キーを回したりするなど、複雑なアクションを実行するようにモデルをトレーニングできます。この研究は、義肢、身体リハビリテーション、外科手術技術の開発を加速させるだけでなく、メタバース用のよりリアルなアバターの開発にも役立つ可能性があります。私たちはこれらのモデルをオープンソース化し、研究者がそれらを使用してこの分野をさらに前進させることができるようにします。

まあ、下に示されているのは実際には「缶掴み」ではなくペン回しだとは予想していませんでした…

しかし、これは確かにちょっと厳しすぎます！

ああ、キーターナーもあります。（もう慣れたので文句は言えません）

話を戻しますが、このモデルはまだ初期段階のようですが、さまざまな細部のコントロールは非常に完璧です。

コントロールバーをスライドして親指を伸ばし、残りの 4 本の指を 1 本ずつ引っ込め、最後に腕を回転させます...

さあ、親指を立ててあげましょう！

さらに、研究がさらに進めば、Meta の「アバター」は、単なるかわいい漫画のイメージではなく、解剖学的に正確な一連の骨と動きを持つことができるようになるでしょう。

神経知能と運動知能の「大統合」

生物が賢ければ賢いほど、より複雑な運動行動を示すようになります。

したがって、検討すべき重要な質問は、このような複雑な意思決定とそれを実行する運動制御を可能にするものは何なのか、ということです。

Meta は、MyoSuite の開発はこの問題を探求することだと考えています。

論文アドレス: https://drive.google.com/file/d/10Le1OmOpy-Veb7n41ywrYLxyipoGfHtt/view

MyoSuite は、機械学習を使用して生体力学的制御問題を解決するための筋骨格モデルとタスクのスイートを提供します。

Meta 氏は、MyoSuite のもう 1 つの重要な意義は、運動知能と神経知能という知能の 2 つの側面を統合し、機械学習コミュニティ向けの包括的なベンチマークセットをオープンソース化していることだと述べました。

人間の生体力学は、複雑な多関節、多アクチュエータの筋骨格系です。筋肉の収縮には複数の関節の屈曲が伴い、各関節の動きは複数の筋肉によって制御されます。

このような複雑なシステムで知的な行動を統合し表現するには、数十億のニューロンのネットワークを通じて決定を統合する中枢神経系と、これらの意図を行動に変換する末梢筋骨格系の間の効果的な調整が必要です。

MyoSuite は、既存のモデルと機能研究の徹底的な研究を通じて開発されました。その研究開発の基盤は、現在、人間の神経機械制御、人間とコンピューターの相互作用、リハビリテーションの分野で広く使用されている腕と手の OpenSim モデルです。

これらのモデルを MuJoCo に実装するために、研究者は、骨格と筋肉の付着部の幾何学的変換、腕のトルクの最適化、筋力の最適化のための新しいモデルを開発するためのパイプラインを開発しました。

MyoSuite は、テスト用に生理学的に正確な筋骨格モデルのポートフォリオをいくつか提供しています。モデルの構築は、次の 3 つのステップに分けられます。

1. ジオメトリ変換。これには、関節の形状、筋肉の付着点、ラッピングサーフェスの変換が含まれます。このステップは以前の作業に基づいています。

2. パワーアームの最適化。 MuJoCo でラップされた面の 3D 位置を最適化します。参照 OpenSim モデルと一致するモーメントアームを実現するための MuJoCo でのラッピングサーフェスの 3D 位置。

3. 筋力の最適化: MuJoCo の筋肉パラメータを最適化して、制御 OpenSim モデルに一致する筋力を実現します。厳密なモデリングと検証を経て、最終的に複雑さのレベルの異なる 3 つのモデルが確立されました。

MyoSuite に含まれる筋骨格モデル。 A: MyoFinger (4 つの関節、5 つの筋肉)、B: MyoElbow: (1 つの関節、6 つの筋肉)。 C: MyoHand（関節数23、筋肉数39）。

指 (MyoFinger): まず、一連の単純化された 5 つの拮抗筋腱ユニットによって駆動される、単純化された直感的なモデル、つまり 4 自由度 (DoF) の指 (MyoFinger、上図 A) を構築します。研究チームは比較研究を容易にするために、シンプルなトルクドライブを提供しました。

肘 (MyoElbow): OpenSim のデフォルト設定に基づいて腕モデルをテストし、複数の主動筋/拮抗筋ペア (3 つの屈筋と 3 つの伸筋) を使用して駆動する、人間の肘関節の 1 DOF モデルです (上図 B)。

手 (MyoHand): 実際には前腕、手首、手が含まれます。人間の手の器用さには、さまざまな関節に補完的および拮抗的な影響を及ぼす複数の高度に冗長な筋肉の協調が必要です。このより複雑な筋骨格モデルは、29 個の骨、23 個の関節、および 39 個の筋腱ユニットで構成されています (図 C)。

人工知能の分野では長年にわたり、神経構造、つまりニューラルネットワークを通じて知的な行動を模倣しようと試みられてきました。バイオメカニクスのコミュニティでは、筋骨格系は、末梢駆動力を理解するために、主に生体内および生体外の研究を通じて独自に開発されてきました。

MyoSuite により、研究者は、豊富なインタラクティブ環境でインテリジェントな動作を発揮するために必要な、さまざまな固有受容信号を利用して体全体の運動制御を調整し、感覚運動制御の詳細をさらに進歩させることが期待されます。

MyoSuite の生理学的にリアルな筋骨格モデルは、既存のモデルに比べて計算効率と拡張性が 4,000 倍優れています。

このような強力なリソースとコンピューティング効率のサポートがあれば、片手でペンを回したり、鍵を回したり、クルミを回したりすることも当然問題ありません。

さらに、これらの「派手なトリック」は、MyoSuite が「何ができるか」、そして将来「何ができるか」を伝えるためのものです。Meta 氏はまた、主にスポーツリハビリテーション、義肢開発、人間工学的応用になると述べました。

将来の義肢は、オリジナルのものよりも優れたものになるでしょうか?

MuJoCo オープンソース

AlphaGoからMuZeroまで、機械学習アルゴリズムはこれまで多くの複雑な問題を解決してきましたが、複雑な動作制御の分野では広く使用されていません。Meta氏は、主な理由は複雑な外部環境と対話する能力が不足していることだと考えています。

言い換えれば、既存のフレームワークには、複雑で熟練した運動タスクが組み込まれておらず、機械学習アルゴリズムのデータ要求を満たすのに十分な計算効率や拡張性もありません。

Meta 氏は、MyoSuite がそれらのギャップを埋めることを約束していると述べています。

現在、MyoSuite は MuJoCo v2.1.0 を使用して MacOs および Linux でテストされています。

偶然にも、DeepMind も同日に MuJoCo をオープンソース化しました。

プロジェクトアドレス: https://github.com/deepmind/mujoco

MuJoCoはもともとワシントン大学の神経科学者で運動制御研究所所長のエモ・トドロフ氏によって開発され、2015年にスタートアップ企業Robi LLCを通じて商品化された。

2021年10月、DeepMindはMuJoCo物理シミュレーターの買収を発表し、MuJoCoを無料のオープンソースのコミュニティ主導プロジェクトとして開発および維持することを約束しました。

物理シミュレーターは、現在のロボット研究にとって重要なツールです。一般的には、商用のクローズドソースソフトウェアと学術的なオープンソースソフトウェアに分けられます。

最初のカテゴリはユーザーにとって不透明であり、自由に使用できる場合もありますが、変更できず、理解しにくいものです。 2 番目のカテゴリは通常、ユーザーベースが小さく、開発者や保守担当者が卒業すると問題が発生します。

MuJoCo は、定評のある企業がサポートする、真のオープンソースである数少ないフル機能のシミュレーターの 1 つです。

研究主導型の組織である DeepMind は、MuJoCo を、ロボット工学者やエンジニアが世界最高のロボットシミュレーターの開発に参加できる共同プラットフォームであると考えています。

現在、DeepMindのオープンソース作業は完了しており、MuJoCoのコードベース全体がGitHubにアップロードされています。

<<: 深い知識の 6 つの次元: 人工知能に世界を真に理解させるにはどうすればよいでしょうか?

>>: Googleが絵画におけるAI使用の権利を取り戻す、ネットユーザー「DALL・E 2は発売からわずか1ヶ月で時代遅れ？」

ブログ

AIはどのようにして責任を持つようになるのでしょうか?英国規格協会が答えを持っている

DeepMindがMuJoCoをオープンソース化！メタは「スケルトンハンド」にクルミをプレイさせるために使用されます

ザッカーバーグ：メタバースのアバターは救われる

神経知能と運動知能の「大統合」

MuJoCo オープンソース

AIはどのようにして責任を持つようになるのでしょうか?英国規格協会が答えを持っている

Spark を使用して行列分解推奨アルゴリズムを学習する

LiDARとTexas Instrumentsチップを搭載した最新のL3自動運転アーキテクチャの分析

転移学習とクロスドメイン推奨、およびクロスドメイン推奨のソリューション

大型モデルがドローンを制御できるように、北京航空航天チームは具現化された知能の新しいアーキテクチャを提案した

医療製造におけるビジョンテクノロジー

百度のCTO王海鋒が百度ブレイン7.0をリリース: イノベーションを統合し障壁を下げる

コードスイッチングに7億5000万ドル？ Facebook TransCoder AI は 1 つで十分です。

推薦する

Keras によるステートフル LSTM リカレントニューラルネットワークの理解

機械学習で避けるべき3つのよくある間違い

コンテキスト化によって生成型AIの可能性を解き放つ方法

LIama2を運営して8400万元稼ごう！最速のAI推論チップのコスト見積もりが白熱した議論を巻き起こす

2020年の中国の人工知能開発の見通し

AI導入を成功させるために最も重要なスキル

AMiner が発表: 2022 年に世界で最も影響力のある人工知能学者「AI 2000」

機械に漢字の一画一画の謎を理解させるにはどうすればいいでしょうか?

人工知能は実際のデータセットを「放棄」するのか?

私が嫌いな人工知能

Dropbox のエンジニアがロスレス圧縮アルゴリズム「Pied Piper」を開発

北京大学と智遠は、大規模モデルが自律的にオープンワールドを探索できるようにするトレーニングフレームワークLLaMA-Riderを提案した。