最新のロボット学習システムが登場、たった1本の動画で仕事内容を学習可能

最新のロボット学習システムが登場、たった1本の動画で仕事内容を学習可能

近い将来、人間はロボットにやり方を一度見せるだけで、タスクの実行方法を教えることができるようになるかもしれません。カリフォルニア大学バークレー校の研究者たちは、機械の友達の教育をスピードアップする方法を開発した。最近の論文で、研究者らは、ロボットがビデオで一度見た動作をシミュレートできるようにする新しい学習アルゴリズムを発表した。

[[235484]]

ロボットのトレーニングは、現在では困難な作業です。カップを手に取るといった非常に単純な動作でさえ、各ステップでロボットに何をすべきかを指示するために、何段落にもわたるコードが必要です。このプログラミング プロセスは、人間にとって難しく、複雑で、時にはイライラすることもあります。

コードが完全に記述された後でも、まだやるべき作業はたくさんあります。組立ライン上のロボットを例に考えてみましょう。すべての指示が回路に入力された後、ロボットは各ステップを繰り返す長いトレーニング プロセスを経る必要があります。間違いを起こさずにタスクを完了できるようになるまで、このプロセスを何度も繰り返す必要があります。

最近、プログラマーは、ロボットが特定のタスクを実行するのを観察するだけでロボットをプログラムできるソフトウェアを開発しました。この学習方法は、人間や動物の学習方法と非常に似ていますが、それでもまだ不器用な方法です。現在、ロボットの友達が習得するまでに、このようなトレーニング ビデオを何千回も見せる必要があります。

しかし、カリフォルニア大学バークレー校の研究チームは、たった一度の観察からロボットが人間の行動を学習できるようにする新しい技術を開発したと発表しました。研究者らは、この技術は模倣学習とメタ学習アルゴリズムを組み合わせたものだと述べている。

彼らはこのシステムを「モデルに依存しないメタ学習システム(略して MAML)」と名付けました。メタ学習とは本質的に、学習することを学ぶプロセスを意味します。 MAML システムとは、ロボットが過去の経験に基づいて何か新しいことを学習できることを意味します。たとえば、誰かがリンゴを取ってカップに入れるビデオをロボットに見せると、ロボットはリンゴをカップに入れることが目的であると推測できます。

これらのオブジェクトの処理方法を学習すると、その知識を他の同様の動作に一般化できるようになります。次に、例えば誰かがオレンジを皿の上に置くビデオを見せると、ロボットはそれらの動作を認識し、それをタスク自体を完了するために必要な動きに素早く変換できるようになります。

組立ラインのロボットは、オレンジが何であるか、お皿が何であるかを理解する必要がなく、完了する必要のあるタスクを実行するだけで済みます。つまり、MAML システムは、ニューラル ネットワークやロボットが比較的少ないデータでさまざまなタスクを実行する方法を学習できるプラットフォームを提供します。これは、単純なタスクを実行するために膨大な量のデータを必要とする現在のニューラル ネットワークの動作とほぼ正反対です。

研究チームは、MAML システムを複数のロボットでテストしました。研究者らは、デモンストレーションビデオを見せた後、ロボットはビデオで示されたタスクを正常に完了することができたと主張している。研究者らは、メタ学習後、ロボットは人間のデモンストレーションビデオの助けを借りて、新しい物体を置いたり、押したり、拾ったり、配置したりすることを学習できるようになると推測している。

<<:  効果よりも研究が重要です。バイオニックロボットはどうすれば実用化できるのでしょうか?

>>:  海外メディア:人間はますます余暇を持ち、AIは資本主義を排除する

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

河南省鄭州市:自動運転オンライン配車サービス車両が一般公開

[[408894]]河南省鄭州市では7月1日、鄭東新区で自動運転バスと自動運転乗用車が運用開始され、...

2018 年の人工知能と機械学習のトップトレンド

[[243985]]人工知能(AI)は、1955年に米国のダートマス大学のAIの第一人者ジョン・マッ...

テスラのオプティマスロボットプロジェクトは強化学習などの分野でエンジニアを募集している

テスラは11月1日、強化学習の専門家を含むヒューマノイドロボットプロジェクト「オプティマス」のエンジ...

Google AI 面接の質問(回答と戦略付き)

おそらくすべてのプログラマーは Google への入社を考えたことがあるでしょう。しかし、「試験」に...

Google の最新のオープンソース Gemma モデルが Llma-2 を数秒で上回りました。

ジェマとはジェマ軽量で最先端のオープンモデルシリーズで、 ジェミニ同じ研究と技術をモデル化します。 ...

今後5年間で働くのに適した5つの職種

「中国製造2025」という言葉を聞いたことがありますか。これは、中国が2025年までに産業の徹底的な...

ディープラーニングフレームワークFlashを使用して、わずか数行のコードで画像分類器を構築する方法

[[412621]] 【51CTO.com クイック翻訳】 1. はじめに画像分類は、画像がどのクラ...

SQLデータベースに基づくアルゴリズムを学ぶ

データベースは、データを保存し、大規模な計算を実行する場所です。現実世界の問題を解決するために、デー...

2020 年のソフトウェア テストの 5 つのトレンド

[[285865]] [51CTO.com クイック翻訳] デジタル技術の広範な応用に伴い、ソフトウ...

GitHub 6600 スター、中国人向け: Microsoft AI 教育および学習共同構築コミュニティ 2.0 が開始!

最近のGithubトレンドホットリストでは、Microsoft Research AsiaのAI教育...

2020 年の最後の 1 か月間に発生した 1,694 件の AI インシデントを包括的にレビューします。ハイライトは何ですか?

今月、ニュースイベント分析、マイニング、検索システム NewsMiner のデータによると、図 1 ...

GPT-4 パラメータに関する最新の情報! 1.76兆個のパラメータ、8220億個のMoEモデル、PyTorchの創設者は確信している

皆さん、GPT-4 のパラメータは 1 兆を超える可能性があります。最近、アメリカの有名なハッカーで...

ゴリラもMinecraftをプレイできるようになり、動画を一度見るだけで新しいスキルが手に入る

GPT-4にMinecraftの遊び方を教えた後、人間はゴリラにもこのゲームの遊び方を教えました。写...

アプリケーション管理における AI/ML のユースケース

[[320826]]概要人工知能ベースの運用 (AIOps) は、人工知能と従来の AM/IM 運用...