ロボットに25分で6つの動作を学習させるトレーニング、バークレーは効率的なロボット操作フレームワークを開発

ロボットに25分で6つの動作を学習させるトレーニング、バークレーは効率的なロボット操作フレームワークを開発

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

このロボットアームは、手を伸ばす、取る、動かす、押す、クリックする、開くという 6 つの動作を実行します。

さらに、彼の動きは巧みで、ミスはなかった。

さらに驚くべきことは、このロボットアームのトレーニングにたった25 分しかかからなかったことです。

人間の介入があっても、掴む動作を正常に完了できます。

これまで見たことのない物体の形も捉えることができます。

これは、カリフォルニア大学バークレー校の「効率的ロボット操作フレームワーク (FERM)」による新しい研究であり、ロボットアームの効率的な操作のためのアルゴリズムをトレーニングするために特別に設計されています。

FERM が他の方法よりも効率的なのはなぜですか?

現在、ロボットトレーニング用のほとんどの RL アルゴリズムはあまり効率的ではありません。

スパース報酬法を使用して、Dota 5 ゲームの人間と機械の操作を熟練した人間プレイヤーのレベルまでトレーニングするには、ゲーム時間で 180 年かかります。

ロボットアームのジェスチャーをトレーニングするには、数千万のシミュレーション学習サンプルと 2 週間のトレーニング時間が必要です。

Sim2RealSimulation Learning の方が若干優れています。 Sim2Real はシミュレーショントレーニングを受け、その後トレーニング結果を実際のケースに適用する必要があります。

シミュレーション学習では、最終的なトレーニング戦略を考案するために、一連の専門的なトレーニングデモンストレーションケースと教師あり学習が必要です。実験結果は、入力デモンストレーションケースの品質に大きく依存します。

FERM の利点は、シミュレーション トレーニングを現実に変換する必要がなく、入力デモンストレーション ケースの品質に大きく依存しないことです。

代わりに、教師なし表現学習とデータ拡張技術に基づくピクセルベースの RLを使用します。

したがって、ロボットが 6 つのアクションを学習するには、10 回のデモと 25 分のトレーニング時間しかかかりません。

FERM を具体的にトレーニングするにはどうすればいいですか?

FERM はピクセルベースの強化学習 (ピクセルベース RL)アプローチを使用します。

具体的には、まず少量のデモンストレーション データが収集され、「再生バッファ」に保存されます。

次に、観察結果を使用して、対照損失を使用してエンコーダーを事前トレーニングします。

次に、エンコーダーと「リプレイ バッファ」はオフライン データを使用して RL アルゴリズムを強化し、RL エージェントをトレーニングします。

論文の中で、研究者らは FERM の主な利点を次のようにまとめています。

1.高効率: FERM は 6 つの異なる運用タスクの最適な戦略を学習し、15 ~ 50 分のトレーニング時間内に各タスクを完了できます。

2.シンプルな統合フレームワーク: このフレームワークは、既存のコンポーネントを組み合わせて、教師なし事前トレーニングとオンライン RL をデータ拡張とともに 1 つの効率的なフレームワークに統合します。

3.従来の軽量セットアップ: 実装には、ロボット、GPU、2 台のカメラ、いくつかのデモンストレーション、スパース報酬関数などのみが必要です。

具体的な実験結果は何ですか?

実験結果

この実験では、ピクセル単位のアプローチを使用して一連のタスクを実行しました。下の図の各列には、初期、中間、結果の 3 つの状態が表示されます。ロボットがタスクを完了した場合にのみ、まばらな報酬を受け取ります。

このトレーニング アルゴリズムの効率は非常に高いです。具体的な完了時間は下表の通りで、約30分でロボットは操作タスクを学習できます。シンプルな「リーチ」動作には、わずか3 分しかかかりません。

実験結果によると、多くのデモや大量の機器は必要なく、初めてタスクを完了するまでの平均時間は 11 分で、25 分以内に 6 つの機械的動作をトレーニングできます。

そこで研究者たちは誇らしげにこう言う。

「私たちの知る限り、FERM は、スパース報酬アプローチを使用して 1 時間以内に多様なグループからピクセル単位で直接実行できる初の機械操作タスクです。」

関連レポートによると、製造業では今後10年間で460万人の雇用が必要になるという。多くの製造業者も自動化生産に移行しており、機械による自動化の割合はますます高くなるでしょう。 FERM のような効率的なトレーニング フレームワークは、製造業界にとって大きな恩恵となります。

<<:  EUのドローン関連法は国内メーカーにとって恩恵か、それとも災いか?

>>:  量子コンピュータ、数学オリンピックのための AI... これらは 2020 年のコンピュータと数学における大きな進歩です

ブログ    
ブログ    

推薦する

開発者向け機械学習プラットフォーム 18 選

[[255723]]機械学習プラットフォームは未来の波ではなく、今起こっていることです。開発者は、自...

人工知能はデータセンター管理における破壊的技術となる

データ センターは、他のテクノロジー ベースの業界と同様に、革新を続けなければ成功できません。従来の...

清華大学チームは、蛍光画像から自己教師あり方式でノイズを除去する空間冗長性ノイズ除去トランスフォーマー法を開発

高い信号対雑音比を備えた蛍光イメージングは​​、生物学的現象の正確な可視化と分析の基礎となっています...

Google の新しい AI ツールが人間のコールセンター従業員に取って代わる可能性があります。

[[237962]]海外メディアの報道によると、Googleは本日開催されたCloud Nextカ...

AIと新技術が商業用不動産投資に革命を起こす

商業用不動産業界は進化を遂げており、人工知能 (AI) などのテクノロジーが、このダイナミックな市場...

近年、軍事用人工知能スタートアップが人気を集めている理由

ロシアとウクライナの紛争が始まって2週間、データ分析会社パランティアのCEO、アレクサンダー・カープ...

...

AI検出器は復活するのか?成功率は98%と高く、OpenAIを上回っている。

現在の AI テキスト検出器には、AI が生成したテキストと人間が作成したテキストを効果的に区別する...

Pythonで簡単な顔認識を実装すると、私はこの星にとても似ていることが判明しました

近年、人工知能の人気が急上昇しており、画像認識、音声認識、機械翻訳、自動運転車など、AI の能力と威...

ファインマン・ラプソディ:体内に入ることができる「外科医」

1959年、ノーベル物理学賞受賞者のリチャード・ファインマンは、カリフォルニア工科大学での「体の底...

ディープラーニング: オートエンコーダの基礎と種類

ディープラーニングが私たちの社会に大きな影響を与えようとしていることは明らかです。 Mobibit ...

彼は17歳でiOSの脱獄の父となり、25歳で自動運転車を開発した。

[[271960]]彼は5歳の時に初めてコンピュータプログラムを書きました。14歳の時、自作のマッ...

汎用人工知能は存在するのか?

現在、一部の学者は、汎用人工知能を研究したいと言っています。これは、機械翻訳、音声認識、画像の分類と...

...

Llama 2 の精度を 80.3% まで高めるヒントは何でしょうか? Metaは、モデルの幻覚を大幅に削減する新しい注意メカニズムS2Aを提案している。

2023年の科学技術の世界は、(偽の室温超伝導を除いて)大型モデルが主流であると言えます。私たちは...