四足歩行ロボットが二足歩行で階段を降りることを学びます。脚型システムより83%効率が高い

四足歩行ロボットが二足歩行で階段を降りることを学びます。脚型システムより83%効率が高い

テスラと競争したロボットを覚えていますか?

これは、チューリッヒにあるスイス連邦工科大学のスピンオフ企業が開発した四足車輪ロボット「スイスマイル」です。会社名と同じ名前で、四足車輪ロボット「ANYmal」の前身です。

テスラと競合してから半年も経たないうちに、大幅なアップグレードが行われた。

このアップグレードにより、ロボットのアルゴリズムが改善され、移動能力が直接的に向上しました。

両足で立って階段を降りることができます。

(編集者の心の声:ローラースケートを履いて階段を降りたら、きっと顔から転んでしまうだろう)

階段を登るのは疲れましたか? エレベーターに乗って、前足でエレベーターのドアを開けましょう:

障害に簡単に立ち向かう:

また、いつ立ち上がるべきか、いつ「横たわるべき」かも分かっており、直立した二足歩行と四足歩行の切り替えもよりスムーズです。

AMPアルゴリズムが初めて実際のロボットに適用されました

Swiss-Mile は以前、モデル予測制御 (MPC) と強化学習 (RL) の手法を使用していましたが、望ましい動作パターンを実現するには面倒な調整が必要でした。

このアルゴリズムのアップグレードでは、研究者は、マルチ AMP (Adversarial Motion Priors) アルゴリズムを使用して従来の強化学習フレームワークを強化し、ヒューリスティックなしで複数のモーション プライアの模倣目標とモーション選択プロセスを自動的に実行できるようになりました。

AMP とは何でしょうか?

これは、カリフォルニア大学バークレー校と上海交通大学の研究者によって提案された、物理的なキャラクターアニメーションに基づく敵対的学習システムであり、Swiss-Mile がこの手法を初めて実際のロボットに適用しました。

一般的な模倣学習では、通常、追跡対象として模倣する必要のある大量のモーション クリップを手動で抽出する必要があります。AMP は、適切なアクション クリップを自動的に選択して、ターゲット タスクを達成できます。エラー メトリック、位相、モーション クリップの選択を識別器にアウトソーシングし、識別器はモーション データの戦略と状態遷移を区別することを学習します。

シミュレーションと展開のトレーニング

研究者らは、アイザック・ジム・シミュレーターを使用して、16 自由度のスイス・マイルにマルチ AMP フレームワークを展開し、4,000 台を超えるロボットが 42 分間で同時にスキルをトレーニングすることができました。

トレーニング環境は、次の 3 つのタスクで構成されます。

最初のタスクは四足歩行であり、モーション データは RL ポリシーによって記録されたモーションで構成されます。

2 番目のタスクは、回避スキルを使用してロボットがテーブルの下に隠れることを可能にすることです。スキルのモーション データは、軌道最適化パイプラインによって生成され、MPC コントローラーによって展開および追跡されます。

最後のタスクは、「立つ」と「四足歩行」の間の動作の遷移です。ロボットはデータ分離スキルを使用して後ろ足で立ち上がり、二本足で滑走し、最後に立ち上がったときと同じ動きで再び座ります。

最後に、Swiss-Mile は実際の環境に導入されました。研究者は、シミュレーションと現実のギャップを埋めるために脚関節のアクチュエータ モデルを使用し、起伏の多い地形でのトレーニングやランダムな干渉などを活用して堅牢性を向上させました。関節の速度がアクチュエータの限界を超えると、軌道が終了し、ロボットはその限界の安全な許容範囲を維持することを学習します。

四足歩行ロボットかヒューマノイドロボットか?脚ベースのシステムよりも 83% 効率的です。

Swiss-Mile は四足歩行ロボットであるだけでなく、ヒューマノイドロボットでもあります。

脚式システムと比較して、車輪式システムには多くの重要な利点があります。アルゴリズムが改善された後、ロボットは「ヒューマノイドロボット」の状態で直接立ち上がることができ、滑走、階段の昇降、下り坂などの難しい動作を実行できます。より速く、より効率的に移動でき、四足歩行よりもはるかに速く、脚式システムよりも効率が83%高くなります。

同社は将来、地図作成、点検、災害救助、都市環境での物流など、さまざまな用途に車輪付きロボットを商品化したいと考えています。

いつの日か、ロボットが上げている「前脚」を腕のように使って急送品を掴み、背中の貨物室に置き、その後四つん這いに戻ってできるだけ早く商品を玄関まで届ける姿を目にする日が来るかもしれません。​

<<:  平均して、1 秒で 1 つの高得点大学入試エッセイが生成されます。PaddlePaddle Wenxin モデルはどのようにしてこれを実現するのでしょうか?

>>:  インテリジェント運転認識システムのテスト技術を説明する記事

ブログ    
ブログ    
ブログ    

推薦する

ディープニューラルネットワークを使用してNER固有表現抽出の問題を解決する

この記事は次のように構成されています。固有表現抽出 (NER) とはどのように識別しますか? cs2...

...

分散トレーニング入門: PyTorch を使用してマルチ GPU 分散トレーニングを実装する方法

具体的には、この記事ではまず、分散コンピューティングの基本概念と、分散コンピューティングがディープラ...

生産効率の向上以外に、AI テクノロジーは製造業に何をもたらすのでしょうか?

現代科学技術の発展は製造業の変革と向上に新たな活力をもたらしており、人工知能技術もその一つです。 [...

OpenAI CEOがGPT-5の開発中であることを明らかに

11月14日、海外メディアの報道によると、OpenAIはGPT-5の構築を開始した。同社のCEOサム...

...

...

通信ネットワークにおけるOSPFプロトコルの適用とアルゴリズムの最適化

3G通信技術は広く利用されており、4Gに向けてますます進化しています。通信ネットワーク内のアクセスス...

マイクロモード動的顔認識制御システムソリューション

マイクロモードの動的顔認識制御システム、インテリジェントビデオ監視は、元のビデオ監視に基づいてインテ...

新参者と大企業が直接会うとき、研究室なしではやっていけないことがよくある | T Guanhai

インタビューゲスト | アンジー・チュー、ロージー・チャン編集者 | ユン・チャオ海を観察する人は、...

4 つの主要ビジネス分野における業界に関するインテルの詳細な洞察、アプリケーション事例、革新的な製品とソリューションの解釈 | Intel Vision

ポストパンデミックの時代において、在宅勤務によって従業員の生産性を最大限に引き出すにはどうすればいい...

人工知能が教育分野に参入し「スマート教育」を創出

最先端の技術力に加え、人工知能は教育分野にも進出し始めています。北京では先日、中国・外国教師科学教育...

「アンティーク」GPUでもDeepSeekと同じGRPOを実行できます。ビデオメモリは1/10しか必要とせず、コンテキストは10倍に増加します

オープンソースの微調整ツール Unsloth が新しいテクノロジーを携えて戻ってきました。前回のアッ...

「人工知能、データサイエンス、機械学習」について語る -- 概要

[[190364]]この記事は、写真付きの 4 つの例を含む 6 時間かけて執筆されました。目的は、...

人工知能を通じて「自分を知る」

2016年、AlphaGoが人間のチェスプレイヤーであるイ・セドルを破り、人工知能に関する研究と考...