DeepMindがMuJoCoをオープンソース化!メタは「スケルトンハンド」にクルミをプレイさせるために使用されます

DeepMindがMuJoCoをオープンソース化!メタは「スケルトンハンド」にクルミをプレイさせるために使用されます

「クルミで遊んでいる」骸骨の手を見たことがありますか?

この魔法の「手」は、Meta が新たにリリースした AI プラットフォーム MyoSuite から生まれました。

うーん...私にはターミネーターの視覚感覚がある。

ザッカーバーグ:メタバースのアバターは救われる

伝統的な業界では、「一流企業は基準を設定し、二流企業はブランドを構築し、三流企業は製品を作る」という有名な格言があります。

この発言は少々絶対的ですが、業界標準の策定に参加する一流企業の多くは一流のブランドや製品を有していますが、この発言が主に強調しているのは、業界にとって「標準」がいかに重要であるかということです。

標準を管理する者は、ゲームのルールを設定する発言権を持ち、業界の「銀行家」になる可能性を秘めています。

AI時代には、テクノロジーの巨人たちも「標準」というビジネスの優位性を競っていますが、フレームワーク、プラットフォーム、ベンチマークなど、業界標準の意味を持つ新しい名前をたくさん変えてきました。

Metaも例外ではありません。

もちろん、ザッカーバーグがメタバースに全力を注ぎ、名前まで変えれば、すべてがメタバースに存在することになる。

ペンを回したり、キーを回したりするなど、複雑なアクションを実行するようにモデルをトレーニングできます。この研究は、義肢、身体リハビリテーション、外科手術技術の開発を加速させるだけでなく、メタバース用のよりリアルなアバターの開発にも役立つ可能性があります。私たちはこれらのモデルをオープンソース化し、研究者がそれらを使用してこの分野をさらに前進させることができるようにします。

まあ、下に示されているのは実際には「缶掴み」ではなくペン回しだとは予想していませんでした…

しかし、これは確かにちょっと厳しすぎます!

ああ、キーターナーもあります。 (もう慣れたので文句は言えません)

話を戻しますが、このモデルはまだ初期段階のようですが、さまざまな細部のコントロールは非常に完璧です。

コントロール バーをスライドして親指を伸ばし、残りの 4 本の指を 1 本ずつ引っ込め、最後に腕を回転させます...

さあ、親指を立ててあげましょう!

さらに、研究がさらに進めば、Meta の「アバター」は、単なるかわいい漫画のイメージではなく、解剖学的に正確な一連の骨と動きを持つことができるようになるでしょう。

神経知能と運動知能の「大統合」

生物が賢ければ賢いほど、より複雑な運動行動を示すようになります。

したがって、検討すべき重要な質問は、このような複雑な意思決定とそれを実行する運動制御を可能にするものは何なのか、ということです。

Meta は、MyoSuite の開発はこの問題を探求することだと考えています。

論文アドレス: https://drive.google.com/file/d/10Le1OmOpy-Veb7n41ywrYLxyipoGfHtt/view

MyoSuite は、機械学習を使用して生体力学的制御問題を解決するための筋骨格モデルとタスクのスイートを提供します。

Meta 氏は、MyoSuite のもう 1 つの重要な意義は、運動知能と神経知能という知能の 2 つの側面を統合し、機械学習コミュニティ向けの包括的なベンチマーク セットをオープンソース化していることだと述べました。

人間の生体力学は、複雑な多関節、多アクチュエータの筋骨格系です。筋肉の収縮には複数の関節の屈曲が伴い、各関節の動きは複数の筋肉によって制御されます。

このような複雑なシステムで知的な行動を統合し表現するには、数十億のニューロンのネットワークを通じて決定を統合する中枢神経系と、これらの意図を行動に変換する末梢筋骨格系の間の効果的な調整が必要です。

MyoSuite は、既存のモデルと機能研究の徹底的な研究を通じて開発されました。その研究開発の基盤は、現在、人間の神経機械制御、人間とコンピューターの相互作用、リハビリテーションの分野で広く使用されている腕と手の OpenSim モデルです。

これらのモデルを MuJoCo に実装するために、研究者は、骨格と筋肉の付着部の幾何学的変換、腕のトルクの最適化、筋力の最適化のための新しいモデルを開発するためのパイプラインを開発しました。

MyoSuite は、テスト用に生理学的に正確な筋骨格モデルのポートフォリオをいくつか提供しています。モデルの構築は、次の 3 つのステップに分けられます。

1. ジオメトリ変換。これには、関節の形状、筋肉の付着点、ラッピング サーフェスの変換が含まれます。このステップは以前の作業に基づいています。

2. パワーアームの最適化。 MuJoCo でラップされた面の 3D 位置を最適化します。参照 OpenSim モデルと一致するモーメント アームを実現するための MuJoCo でのラッピング サーフェスの 3D 位置。

3. 筋力の最適化: MuJoCo の筋肉パラメータを最適化して、制御 OpenSim モデルに一致する筋力を実現します。厳密なモデリングと検証を経て、最終的に複雑さのレベルの異なる 3 つのモデルが確立されました。

MyoSuite に含まれる筋骨格モデル。 A: MyoFinger (4 つの関節、5 つの筋肉)、B: MyoElbow: (1 つの関節、6 つの筋肉)。 C: MyoHand(関節数23、筋肉数39)。

指 (MyoFinger): まず、一連の単純化された 5 つの拮抗筋腱ユニットによって駆動される、単純化された直感的なモデル、つまり 4 自由度 (DoF) の指 (MyoFinger、上図 A) を構築します。研究チームは比較研究を容易にするために、シンプルなトルクドライブを提供しました。

肘 (MyoElbow): OpenSim のデフォルト設定に基づいて腕モデルをテストし、複数の主動筋/拮抗筋ペア (3 つの屈筋と 3 つの伸筋) を使用して駆動する、人間の肘関節の 1 DOF モデルです (上図 B)。

手 (MyoHand): 実際には前腕、手首、手が含まれます。人間の手の器用さには、さまざまな関節に補完的および拮抗的な影響を及ぼす複数の高度に冗長な筋肉の協調が必要です。このより複雑な筋骨格モデルは、29 個の骨、23 個の関節、および 39 個の筋腱ユニットで構成されています (図 C)。

人工知能の分野では長年にわたり、神経構造、つまりニューラル ネットワークを通じて知的な行動を模倣しようと試みられてきました。バイオメカニクスのコミュニティでは、筋骨格系は、末梢駆動力を理解するために、主に生体内および生体外の研究を通じて独自に開発されてきました。

MyoSuite により、研究者は、豊富なインタラクティブ環境でインテリジェントな動作を発揮するために必要な、さまざまな固有受容信号を利用して体全体の運動制御を調整し、感覚運動制御の詳細をさらに進歩させることが期待されます。

MyoSuite の生理学的にリアルな筋骨格モデルは、既存のモデルに比べて計算効率と拡張性が 4,000 倍優れています。

このような強力なリソースとコンピューティング効率のサポートがあれば、片手でペンを回したり、鍵を回したり、クルミを回したりすることも当然問題ありません。

さらに、これらの「派手なトリック」は、MyoSuite が「何ができるか」、そして将来「何ができるか」を伝えるためのものです。Meta 氏はまた、主にスポーツリハビリテーション、義肢開発、人間工学的応用になると述べました。

将来の義肢は、オリジナルのものよりも優れたものになるでしょうか?

MuJoCo オープンソース

AlphaGoからMuZeroまで、機械学習アルゴリズムはこれまで多くの複雑な問題を解決してきましたが、複雑な動作制御の分野では広く使用されていません。Meta氏は、主な理由は複雑な外部環境と対話する能力が不足していることだと考えています。

言い換えれば、既存のフレームワークには、複雑で熟練した運動タスクが組み込まれておらず、機械学習アルゴリズムのデータ要求を満たすのに十分な計算効率や拡張性もありません。

Meta 氏は、MyoSuite がそれらのギャップを埋めることを約束していると述べています。

現在、MyoSuite は MuJoCo v2.1.0 を使用して MacOs および Linux でテストされています。

偶然にも、DeepMind も同日に MuJoCo をオープンソース化しました。

プロジェクトアドレス: https://github.com/deepmind/mujoco

MuJoCoはもともとワシントン大学の神経科学者で運動制御研究所所長のエモ・トドロフ氏によって開発され、2015年にスタートアップ企業Robi LLCを通じて商品化された。

2021年10月、DeepMindはMuJoCo物理シミュレーターの買収を発表し、MuJoCoを無料のオープンソースのコミュニティ主導プロジェクトとして開発および維持することを約束しました。

物理シミュレーターは、現在のロボット研究にとって重要なツールです。一般的には、商用のクローズドソース ソフトウェアと学術的なオープン ソース ソフトウェアに分けられます。

最初のカテゴリはユーザーにとって不透明であり、自由に使用できる場合もありますが、変更できず、理解しにくいものです。 2 番目のカテゴリは通常、ユーザー ベースが小さく、開発者や保守担当者が卒業すると問題が発生します。

MuJoCo は、定評のある企業がサポートする、真のオープンソースである数少ないフル機能のシミュレーターの 1 つです。

研究主導型の組織である DeepMind は、MuJoCo を、ロボット工学者やエンジニアが世界最高のロボット シミュレーターの開発に参加できる共同プラットフォームであると考えています。

現在、DeepMindのオープンソース作業は完了しており、MuJoCoのコードベース全体がGitHubにアップロードされています。

<<:  深い知識の 6 つの次元: 人工知能に世界を真に理解させるにはどうすればよいでしょうか?

>>:  Googleが絵画におけるAI使用の権利を取り戻す、ネットユーザー「DALL・E 2は発売からわずか1ヶ月で時代遅れ?」

ブログ    
ブログ    
ブログ    

推薦する

北京で人工知能アイスクリームマシンがデビュー、IBMは「AI + ブロックチェーン」でダイヤモンドを識別

1. 人工知能搭載のアイスクリームセルフサービス機が北京でデビューDairyXmas AI人工知能ア...

...

JDデジタルJDDコンペティションの優勝者が発表されました

現在、私たちはAIとビッグデータの急速な発展の時期を迎えています。これらの最先端技術は産業界に力を与...

自動運転:距離推定にステレオビジョンをどのように活用するのか?

自動化システムでは、ディープラーニングとコンピュータービジョンが広く普及し、あらゆる場所で利用されて...

自動運転車が将来の都市生活に及ぼす影響

倫理的配慮無人運転車の問題は、自動運転車の倫理性の問題として要約できます。この問題の典型的なバージョ...

一般的なソートアルゴリズムの概要

概要コンピュータサイエンスと数学において、ソートアルゴリズムとは、一連のデータを特定の順序で並べるア...

あなたの脳と音楽ストリーミングは直接つながっているのでしょうか?ニューラリンクの脳コンピューターインターフェースが来月発売予定

ヘッドホンは必要なく、脳コンピューターインターフェースを通じて直接音楽を聴くことができ、体内のホルモ...

ディープラーニングを使って背景を除去し、切り抜きを実現する方法の詳細な説明

上記のコースで、経験豊富な Web 開発者である Alon Burg と出会い、偶然にも同じような興...

Python の高度なアルゴリズムとデータ構造: コレクションの高速クエリとマージ

コード設計では、このようなシナリオによく直面します。2 つの要素が与えられた場合、それらが同じセット...

仕事再開時に間接接触を避けるには?顔認識アクセス制御で徹底した予防と管理を実現

職場復帰の日が近づくにつれ、全国で生産や業務が徐々に再開されているが、同時に防疫活動も緩めてはならな...

...

...

...

...