解読: ボストン ダイナミクスがアルゴリズムを使用してアトラス ロボットの感覚世界を構築する方法

解読: ボストン ダイナミクスがアルゴリズムを使用してアトラス ロボットの感覚世界を構築する方法

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

ボストン・ダイナミクスは1週間前に90秒のビデオを公開した。ビデオでは、アトラスが複雑な障害物コースを完璧に走る様子が映し出されています。多くのネットユーザーは、どのようなブラックテクノロジーがロボットをこれほど賢くしているのか興味を持っています。

ロボットはどのようにしてアスリートのように走ったり、宙返りしたり、ジャンプしたりできるのでしょうか?こうしたエネルギーあふれるデモを作成するのは楽しい挑戦ですが、ボストンの技術的目標は派手なショーを作成することだけにとどまりません。アトラス プロジェクトでは、パルクールを実験テーマとして使い、動的な動き、知覚、制御の関係を通じて関連する問題を研究しました。これらの問題を解決すると、ロボットがよりスムーズに動作するようになります。

パルクールのロボット認識

ロボット認識アルゴリズムは、カメラやライダーなどのセンサーからのデータを戦略に変換し、物理的な動作を計画するために使用されます。 Atlas は IMU、関節位置、力センサーを使用してボディを制御し、バランスを取るために地面を感知しますが、図 1 に示す木箱や狭い橋などの障害物を識別するための認識アルゴリズムも必要です。

図 1: このアニメーションは、Atlas ロボットの深度カメラによって生成された点群の回転ビューを示しています。

Atlas は深度カメラを使用して、1 秒あたり 15 フレームで環境のポイント クラウドを生成します。ポイントクラウドは距離測定データの集合です。 Atlas の認識ソフトウェアは、マルチプレーン セグメンテーションと呼ばれるアルゴリズムを使用して、ポイント クラウドから表面を抽出します。アルゴリズムによって出力されたデータはマッピング システムに入力され、最終的にシステムは Atlas がカメラで捉えたさまざまなオブジェクトのモデルを構築するのに役立ちます。

図 2: 知覚出力によるアトラス レンダリング。

図 2 は、Atlas が認識したオブジェクトと、フィードバックと計算後に計画するアクションを示しています。 左上隅には深度カメラで撮影された赤外線画像があります。メイン画像の白い点は点群を形成します。オレンジ色の輪郭は、パルクール障害物によって検出された長方形の面を示しており、時間の経過とともにセンサーによって追跡されます。これは、Atlas が特定の動作を設定するのに役立ちます。たとえば、緑色の足跡は、次にジャンプしたりジョギングしたりする場所を示します。

パルクールのコースを延長するために、ロボットには、どこへ行くか、途中でどのような動きをするかのコマンドを含む高度なマップが提供されます。この高レベルマップは実際のコースと正確には一致していませんが、障害物の位置といくつかの主な動きの簡単な説明です。そのため、Atlas はこの概要情報を使用してナビゲーションを行い、リアルタイムの知覚データを使用して詳細を入力します。たとえば、アトラスはジャンプできる箱を探し、その箱が横に 0.5 メートル移動すると、アトラスはそこに箱を見つけて姿勢を調整します。ボックスが遠くに移動しすぎると、システムはボックスを見つけられず停止します。

図 3: パルクール コースにおけるロボットのパートナー認識を示すアニメーション。

これは、パルクール障害物コースを走行中にロボットが見ているものと、その内容に基づいたロボットの計画を示す 3D 視覚化です。アクティブに追跡されているオブジェクトは緑色で描画され、オブジェクトの距離が認識範囲を超えると、アイコンが緑色から紫色に変わります。追跡システムは物体の姿勢を継続的に追跡してナビゲーション システムに送信し、ナビゲーション システムは地図上の情報に基づいて対応する物体のグリーン フットプリントを設計します。

行動ライブラリ

アトラスがパルクール プログラムで実行するすべての動きは、「Trajectory Optimization Offline Design」によって作成されたテンプレートから生成されます。 これらのテンプレート ライブラリを使用すると、研究者はライブラリに新しい軌跡や新しい機能を追加できます。

軌道最適化のオフライン設計により、エンジニアはロボットの機能の限界をインタラクティブに探索し、ロボットの計算負荷を削減できます。例えば、ロボットが手足を折り曲げてバック宙をする方法など、これらの成果はプロジェクトの前進に大いに役立ちます。これはロボットが最も合理的な運転を実現するのに役立つからです。研究者は、オフライン最適化を使用して重要な力のポイントをキャプチャし、コントローラーを使用してオンラインで動きを調整できます。

図 4: この跳び越え動作は、オフライン軌道最適化を使用して設計された複雑な全身動作の例です。

モデル予測

ロボットの前方にある箱、傾斜路、障害物の位置が決定され、それらを乗り越えるための一連の動作が設計されました。残る課題は、ロボットが計画を実行するために必要な詳細を入力することです。

Atlas のコントローラーは、ロボットのダイナミクスのモデルを使用して動作がどのように変化するかを予測するため、モデル予測コントローラー (MPC) と呼ばれます。コントローラーの動作原理は、現時点で最も実行する必要があることの計算を最適化し、可能な限り最良の動作姿勢を形成することです。

前述のように、動作ライブラリ内の各テンプレートは、コントローラーに最適なソリューションを見つけるソリューションを提供します。コントローラーは、環境の形状、足の滑り、その他のリアルタイムの要因を考慮して、力、姿勢、動作のタイミングなどの詳細を調整します。これにより、テンプレートのモーションから逸脱したコントロールが可能になり、独自のモーション プロセスを作成できます。このソリューションにより、ロボットに必要なシナリオ動作テンプレートも大幅に削減されます。たとえば、52cm のプラットフォームからジャンプする場合と 40cm のプラットフォームからジャンプする場合、MPC は詳細を自動的に把握します。

図 5: 認識された経路と計画された経路を示す一人称視点。青い矢印は、ロボットが経路を移動する際におけるロボットの重心と運動量に関する MPC の予測に対応しています。

MPC の予測的な性質により、Atlas は動作の境界を越えることができます。たとえば、ジャンプの後にバックフリップが続くことを認識すると、コントローラーは自動的にスムーズな遷移を作成できます。これにより、研究者が事前に考えられる行動シーケンスについて考える必要がなくなるため、行動作成の問題も簡素化されます。しかし、MPC のイノベーションには限界があります。たとえば、ジョギング動作からバック宙に移行しようとしてもうまくいきません。

未来への基盤を築く

彼らは、Atlas システムにおける動的な動作 (ダンスも含む) の作成と制御について深い理解を得ました。しかし、さらに重要なのは、Atlas システムが自身の環境を感知して変化できるようにすることで、チームとともに成長するスケーラブルなソフトウェア システムを作成する機会が生まれたことです。

この記事はボストンダイナミクスの公式サイトから翻訳されたものです

<<:  青春が戻ってきた! AIが『スラムダンク』の登場人物を実在の人物に変身させたら、一番イケメンは流川楓じゃないのか?

>>:  これは人工ニューラルネットワークの非常に簡単な説明です

ブログ    

推薦する

3つの側面での共同の取り組みにより、人工知能はスマート交通の発展に貢献します。

[[442361]]都市化の継続的な進展と自動車保有数の急速な増加により、我が国の交通発展は困難な...

新たな勢力が市場に参入、コンパイラーの巨匠クリス・ラトナーが自らのビジネスを始める

「私たちのチームは、世界最大かつ最先端のテクノロジー企業出身者で構成されています。世界クラスの才能あ...

...

...

人工知能の「想像力」を実現する

[[416371]] [51CTO.com クイック翻訳]まず、オレンジ色の猫を頭の中で想像してくだ...

ニューラルネットワークにおける量子化と蒸留

この記事では、ディープラーニングにおけるモデルを合理化する技術、量子化と蒸留について詳しく説明します...

MIT、筋肉信号を使ってドローンを制御するシステムを開発

MITの研究者たちは、人間とロボットのシームレスなコラボレーションに近づく可能性のある新しいシステム...

...

...

先頭に立つ! 16人の学際的な専門家がAIの次の10年について語る

ニューヨーク大学の心理学・神経科学教授ゲイリー・マーカス氏と、ディープラーニングの先駆者で2018年...

2021 年に企業に影響を与える自然言語処理のトレンド

[[384737]] [51CTO.com クイック翻訳] 昨今、自然言語技術は企業でますます活用さ...

Google が AI で利益を上げている秘密は何でしょうか?

[[441488]]ビジネスプロセスはインテリジェントではないAI プロジェクトから価値を引き出す...

ディープラーニングの父、ヒントン:次世代ニューラルネットワーク

ディープラーニングの父ヒントン氏:次世代ニューラルネットワーク SIGIRは、情報検索の分野における...

ジェフ・ディーンの大規模マルチタスク学習SOTAは苦情を受け、再現には6万ドルかかる

2021 年 10 月、Jeff Dean が新しい機械学習アーキテクチャである Pathways ...

...