CMU ロボット犬が逆さまに階段を降りる!オープンソースとしてリリース

正直に言うと、私はロボット犬の技をたくさん見てきました -

しかし、私は今日も驚きました。

CMU の最新の研究結果により、犬は直接学習できるようになりました。

体長の2倍の高さまでジャンプしたり、走り幅跳びや逆立ちをしたり、階段を逆立ちで降りたりもできます

では早速、写真を見てみましょう。

これは走り幅跳びです

これは走り高跳びです

△逆立ちして楽しもう

△逆さまに階段を降りる

走り高跳びのシーンでの「奮闘」が、犬の表情を特に魂のこもったものにしている、と言わざるを得ません。

これらの活動に加えて、CMU は完全に自律的なパルクールビデオもいくつか公開しました。

彼は階段を登り、隙間を通り抜け、非常にスムーズに斜面を横切りました。

途中で「間違い」があっても、当面の進行にはまったく影響しません。

笑いネズミはストレステストまで実施し、結果はもちろん「合格」でした〜

最も驚くべきことは、CMU によれば、上記の極端な操作はすべて単一のニューラルネットワークによって完了されるということです。

これを聞いたルカンは親指を立てずにはいられなかった。

そのような魂をどうやって育てればよいのでしょうか?

ツイートの中で、著者は犬の技を一つ一つ分析した。

まず、視覚による端から端までの歩行と比較すると、体長倍の高跳びや走り幅跳びなどの極限動作は、まったく次元の違うものです。

結局のところ、どんな間違いも「致命的」になる可能性があります。

これに対応して、CMU はsim2realを使用して正確な足制御を実現し、機械的利点を最大化することに挑戦しています。

その中で、使用されるシミュレーターはジムです。

2番目は逆立ちです。二足歩行は四足歩行よりも明らかにずっと困難です。

しかし、CMU のロボット犬は同じ基本的な方法を使用して両方のタスクを同時に達成し、逆さまに立ったまま階段を降りることさえできます。

第三に、パルクール動作（本研究の焦点）では、ロボット犬は人間の指示に従うのではなく、正確な「眼筋」の調整を通じて自らの方向を決定する必要がある。

たとえば、2 つのスロープを連続して横断する場合、特定の角度でスロープにジャンプし、すぐに方向転換する必要があります。

こうした正しい方向を学習させるために、CMU はMTS (Mixed Teacher Student)システムを使用してロボット犬に指導を行っています。

その中で、予測された方向が真の値に近い場合にのみ、システムに採用されます。

具体的には、システムは2つの段階に分かれています。

最初の段階では、RL を使用して移動戦略を学習します。このプロセスでは、いくつかの特権情報にアクセスできます。環境パラメータとスキャンポイント(スキャンドット)に加えて、CMU はロボット犬に一般的な方向を誘導するための適切なランドマーク(ウェイポイント)も提供します。

次に、正規化オンライン適応 (ROA)を使用して推定器をトレーニングし、観測履歴からコンテキスト情報を回復します。

第2段階では、スキャンドットから戦略を抽出し、戦略と深度情報に基づいてシステムが自律的に前進方法を決定し、機敏にモーターコマンドを出力します。

全体のプロセスは、「教師が教え、生徒が類推によって学ぶ」ようなものです。

このシステムに加えて、パルクールでは障害物を乗り越えるためにさまざまなアクションが必要なので、障害物ごとに特定の報酬関数を設計することも頭の痛い作業です。

ここで、著者らは、すべてのタスクに対して統一された単純な内積報酬関数を定式化することを選択しました。

さまざまな報酬を自動的に生成し、さまざまな地形の形状に完全に適応できます。

それがなければ、犬は次のように行動します。

最後に、CMU は、深度画像から機敏な動作の指示と急速に変動する方向を抽出するための新しい二重蒸留法も提案しました。

同様に、それがなければ、犬は酔っ払いのように振る舞います。

上記の操作の後、犬はついに新しいタイプの自律パルクールを学習し、難しい動きを織り交ぜるようになりました。

興奮していますか？急がないでください:

CMU は上記の成果をすべてオープンソース化しました(日付を見ると、まだホットです) 。

同時に、この新聞はオンラインでも創刊されました。最後に入手できます。

著者について

この研究は CMU によって完全に完了され、著者は合計 4 名でした。

2人は共著者であり、両者とも中国人である。

Xuxin Cheng は CMU の大学院生時代にこの研究を完了しました。現在は Xiaolong Wang の指導の下、カリフォルニア大学サンディエゴ校(UCSD)の博士課程に在籍しています。

もう1人は、CMU ロボット工学研究所の客員研究員である Shi Kexin 氏です。彼女は西安交通大学を卒業し、学士号を取得しました。

プロジェクトのホームページ（論文、コードなどへのリンクを含む）：https://extreme-parkour.github.io/

<<:

>>: Microsoft OneDrive 3.0 が発表されました: 新しいデザイン、共有の改善、Copilot AI など

中国のトップ 10 の技術革新の一覧。世界をリードする技術も持っています。

ブログ

MATRIX: 社会シミュレーションは、GPT4よりも配慮した大規模なモデル値の自己整合を促進します

ブログ

人材不足は数百万人に達し、人工知能＋教育が一般的なトレンドとなっている

ブログ

企業が人工知能を導入する際に知っておくべき5つの誤解

ブログ

旅の途中のハードウェアプロジェクトが公開されました。 Apple Vision Proのエンジニアがスーパーバイザーを務め、かつてはマスクの脳コンピューターインターフェース企業で働いていた

ブログ

AI医薬品製造の全体像を理解するための1つの記事：年間売上高300億元、明確な3つの階層

ブログ

掃除ロボットはほこりを吸い取るだけでなく、プライバシーも「吸い取る」ことができます

ブログ

ファーウェイクラウド、AIで産業を変革するPangu Big Model 3.0とN-Teng AIクラウドサービスをリリース

ブログ

CMU ロボット犬が逆さまに階段を降りる!オープンソースとしてリリース

そのような魂をどうやって育てればよいのでしょうか?

著者について

中国のトップ 10 の技術革新の一覧。世界をリードする技術も持っています。

MATRIX: 社会シミュレーションは、GPT4よりも配慮した大規模なモデル値の自己整合を促進します

人材不足は数百万人に達し、人工知能＋教育が一般的なトレンドとなっている

企業が人工知能を導入する際に知っておくべき5つの誤解

旅の途中のハードウェアプロジェクトが公開されました。 Apple Vision Proのエンジニアがスーパーバイザーを務め、かつてはマスクの脳コンピューターインターフェース企業で働いていた

AI医薬品製造の全体像を理解するための1つの記事：年間売上高300億元、明確な3つの階層

掃除ロボットはほこりを吸い取るだけでなく、プライバシーも「吸い取る」ことができます

ファーウェイクラウド、AIで産業を変革するPangu Big Model 3.0とN-Teng AIクラウドサービスをリリース

推薦する

8ヵ月後、制御された核融合が再び点火に成功しました！出力エネルギーが3.5メガジュールを超え、記録を更新

実際のシナリオにおける知識グラフに基づく大規模モデル幻覚の原因、評価、緩和戦略の探究

AIによって書かれたコードは「手書きのコード」よりもはるかに安全性が低い

こんなの今まで見たことないよ！ AIの巨人たちが「人類絶滅説」に立ち向かい、ヒントン、アンドリュー・ン、ルカンが排除され、マスクは強く見守った

顔認識技術の新たな進歩：自閉症やADHDを検出できる

自動運転の利点は明らかだ。政治協商会議委員の李延宏氏：大規模な商業利用には政策革新が必要

コンテナ内の AI と機械学習のワークロード: 知っておくべき 6 つのこと

機械学習と従来のプログラミングの違いについて話す

Ma Yi と Shen Xiangyang が協力して、最初の CPAL 賞を発表します。 16人がライジングスター賞を受賞、その半数は中国の学者

機械学習: 教師なし学習: 9 つのクラスタリングアルゴリズム

自然言語処理（NLP）の歴史と方向性

人工知能とはいったい何でしょうか?人工知能の主要なテクノロジーと概念について学びましょう。

AIが起こした恐ろしいことは何ですか?

AIの新興企業が胡潤富豪リストに名を連ねる：「CVの4人の小さなドラゴン」の創業者3人がリスト入り