メタ研究者が新たなAIの試み:地図や訓練なしでロボットに物理的なナビゲーションを教える

メタ研究者が新たなAIの試み:地図や訓練なしでロボットに物理的なナビゲーションを教える

Meta Platformsの人工知能部門は最近、少量のトレーニングデータのサポートにより、AIモデルに物理的な世界での歩行を学習する方法を教えており、急速な進歩を遂げていると述べた。

この研究により、AI モデルが視覚ナビゲーション機能を習得するのにかかる時間が大幅に短縮されます。これまで、このような目標を達成するには、大規模なデータセットと「強化学習」の繰り返しの使用が必要でした。

Meta AI の研究者たちは、AI 視覚ナビゲーションのこの研究は仮想世界に大きな影響を与えるだろうと述べています。このプロジェクトの基本的な考え方は複雑ではありません。単純に観察と探索を通じて、AIが人間のように物理空間内を移動できるように支援することです。

Meta AI は次のように説明しています。「たとえば、AR グラスを使って鍵を探す場合、AI が見慣れない、常に変化する環境レイアウトを理解できるようにする方法を見つけなければなりません。結局のところ、これは非常に詳細で小さな要件であり、多くのコンピューティング リソースを消費する高精度のプリセット マップに常に頼ることは不可能です。人間は、衝突することなく簡単に角を曲がるために、コーヒー テーブルの正確な位置や長さを知る必要はありません。」

この目的のために、Meta は「具現化された AI」、つまり 3D シミュレーションのインタラクティブなメカニズムを通じて AI システムをトレーニングすることに重点を置くことにしました。この分野では、Meta 社は地図や GPS センサーなしで新しい環境をナビゲートできる有望な「ポイント ターゲット ナビゲーション モデル」を構築したと述べています。

このモデルは、視覚測定学と呼ばれる技術を使用しており、これにより AI は視覚入力に基づいて現在の位置を追跡できます。 Meta は、このデータ拡張技術により、手動でデータを注釈付けする必要なく、効果的なニューラル モデルを迅速にトレーニングできると述べています。 Meta 社はまた、独自の Habitat 2.0 具現化 AI トレーニング プラットフォーム (Realistic PointNav ベンチマーク タスクを使用して仮想空間シミュレーションを実行) でのテストを 94% の成功率で完了したと述べました。

メタ氏は、「私たちの方法はまだデータセット内のすべてのシナリオを完全に解決したわけではありませんが、この研究は、現実世界の環境をナビゲートする能力を実現するために必ずしも明示的なマッピングが必要ではないことを最初に実証しました」と説明した。

地図に頼らずに AI ナビゲーション トレーニングをさらに改善するために、Meta は Habitat-Web と呼ばれるトレーニング データセットを作成しました。このデータセットには、人間が実証した 10 万を超えるさまざまなオブジェクト ターゲット ナビゲーション メソッドが含まれています。 Amazon.com の Mechanical Turk サービスには、Web ブラウザ上で実行される Habitat シミュレーターを通じてアクセスでき、ユーザーは仮想ロボットをリモートで安全に操作できます。メタ氏は、得られたデータはAIエージェントが「最先端の結果」を達成するのに役立つトレーニング教材として役立つだろうと述べた。部屋をスキャンして全体的な空間特性を把握したり、角に障害物がないか確認したりすることは、すべて AI が人間から学ぶことができる効率的な物体検索動作です。

さらに、Meta AI チームは、独自の「ゼロサンプル体験学習フレームワーク」を通じて、ロボットがさまざまなセマンティックナビゲーションタスクとターゲットパターンを一般化できるようにする、いわゆる「プラグアンドプレイ」モジュールアプローチを開発しました。このようにして、AI エージェントは、リソースを大量に消費するマップやトレーニングなしで基本的なナビゲーション スキルを習得し、追加の調整なしで 3D 環境でさまざまなタスクを実行できるようになります。

Meta は、これらのエージェントがトレーニング中に画像オブジェクトを継続的に検索すると説明しています。環境内のランダムな場所で撮影された写真を受け取り、自律ナビゲーションを使用してその写真を探します。 Metaの研究者は、「私たちの方法はトレーニングデータを1/12.5に削減し、最先端の転移学習技術よりも成功率が14%高くなります」と述べています。

コンステレーション・リサーチのアナリスト、ホルガー・ミューラー氏はインタビューで、Metaの最新の進歩が同社のメタバース開発計画において重要な役割を果たすことが期待されると語った。彼は、将来仮想世界が標準になるとすれば、AI はこの新しい空間を理解できなければならず、理解にかかるコストは高すぎてはならないと考えています。

ミュラー氏はさらに、「AI の物理世界を理解する能力は、ソフトウェアベースのアプローチによって拡張される必要があります。Meta はこの道を歩み、具現化された AI の進歩を遂げ、トレーニングなしで周囲を理解できるソフトウェアを開発しています。この取り組みの早期の実際の応用を見るのが楽しみです」と付け加えました。

これらの実際の使用例は、そう遠くない将来に実現するかもしれません。 Meta 氏は、次のステップは、これらの進歩をナビゲーションからモバイル操作にまで進め、特定のタスク (財布を識別して所有者に返却するなど) を実行できる AI エージェントを開発することだと述べています。

<<:  Transformer 機械学習モデルとは何ですか?

>>:  5G悪報セキュリティ管理プラットフォームにおけるディープラーニングに基づくテキスト感情認識技術の応用

ブログ    
ブログ    

推薦する

よく使われる「生成AIフレームワーク」を1つの記事で理解する

こんにちは、皆さん。私は Luga です。今日は、人工知能 (AI) エコシステムに関連するテクノロ...

人間に匹敵します!世界初のAI水墨画アーティスト、ジェミニがフリーハンドで中国画を描く

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

企業は AI、IoT、AR、VR、ブロックチェーン、ビッグデータをどのように活用して顧客を維持できるでしょうか?

企業は、顧客維持率と顧客体験を向上させ、競合他社に負けないようにするために、人工知能 (AI)、モノ...

...

...

Tech Neo 9月号:アルゴリズムに基づくIT運用・保守

51CTO.com+プラットフォームは、オリジナルの技術コンテンツの選択と絶妙なレイアウトを通じて、...

なぜ今、AI 画像はすべて女性なのでしょうか?人間とコンピュータの相互作用のメンタルモデルから始めましょう

興味深い質問です。Siri、Cortana、Alexa など、ほとんどの AI ロボットや音声アシス...

2020年から2024年までの中国のインテリジェント交通産業の予測分析

[[374436]] 1.1 中国の数千万規模のインテリジェント交通プロジェクトの競争環境中国投資産...

人工知能が教育評価の近代化に貢献

教育評価は、教育の質の継続的な向上を促進する「牛の鼻」として、確立された教育目標に基づき、一定の教育...

DNAロボットの進化!わずか数分で複雑なナノ構造のデバイスが作成され、体内に入り、タスクを実行します。

[[397076]]ビッグデータ概要著者: ミッキーSF映画には、マイクロロボットが体内に入り、有...

...

機械学習トレーニングマニュアル: 頑固なブロンズから最強の王へ

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

この「ペア」は悪くないですね! AIとのペアプログラミング

翻訳者 |陳俊レビュー | Chonglou 「ペアプログラミング」という概念を聞いたことがあります...

通信 AI 市場は 2031 年に 388 億ドルに達すると予想されます。5G/6G と AI の統合により、さまざまなメリットがもたらされます。

4G と 5G の世界的な展開は商用サービスの進歩よりも速く、6G は 2030 年までに登場する...