メタ研究者が新たなAIの試み:地図や訓練なしでロボットに物理的なナビゲーションを教える

メタ研究者が新たなAIの試み:地図や訓練なしでロボットに物理的なナビゲーションを教える

Meta Platformsの人工知能部門は最近、少量のトレーニングデータのサポートにより、AIモデルに物理的な世界での歩行を学習する方法を教えており、急速な進歩を遂げていると述べた。

この研究により、AI モデルが視覚ナビゲーション機能を習得するのにかかる時間が大幅に短縮されます。これまで、このような目標を達成するには、大規模なデータセットと「強化学習」の繰り返しの使用が必要でした。

Meta AI の研究者たちは、AI 視覚ナビゲーションのこの研究は仮想世界に大きな影響を与えるだろうと述べています。このプロジェクトの基本的な考え方は複雑ではありません。単純に観察と探索を通じて、AIが人間のように物理空間内を移動できるように支援することです。

Meta AI は次のように説明しています。「たとえば、AR グラスを使って鍵を探す場合、AI が見慣れない、常に変化する環境レイアウトを理解できるようにする方法を見つけなければなりません。結局のところ、これは非常に詳細で小さな要件であり、多くのコンピューティング リソースを消費する高精度のプリセット マップに常に頼ることは不可能です。人間は、衝突することなく簡単に角を曲がるために、コーヒー テーブルの正確な位置や長さを知る必要はありません。」

この目的のために、Meta は「具現化された AI」、つまり 3D シミュレーションのインタラクティブなメカニズムを通じて AI システムをトレーニングすることに重点を置くことにしました。この分野では、Meta 社は地図や GPS センサーなしで新しい環境をナビゲートできる有望な「ポイント ターゲット ナビゲーション モデル」を構築したと述べています。

このモデルは、視覚測定学と呼ばれる技術を使用しており、これにより AI は視覚入力に基づいて現在の位置を追跡できます。 Meta は、このデータ拡張技術により、手動でデータを注釈付けする必要なく、効果的なニューラル モデルを迅速にトレーニングできると述べています。 Meta 社はまた、独自の Habitat 2.0 具現化 AI トレーニング プラットフォーム (Realistic PointNav ベンチマーク タスクを使用して仮想空間シミュレーションを実行) でのテストを 94% の成功率で完了したと述べました。

メタ氏は、「私たちの方法はまだデータセット内のすべてのシナリオを完全に解決したわけではありませんが、この研究は、現実世界の環境をナビゲートする能力を実現するために必ずしも明示的なマッピングが必要ではないことを最初に実証しました」と説明した。

地図に頼らずに AI ナビゲーション トレーニングをさらに改善するために、Meta は Habitat-Web と呼ばれるトレーニング データセットを作成しました。このデータセットには、人間が実証した 10 万を超えるさまざまなオブジェクト ターゲット ナビゲーション メソッドが含まれています。 Amazon.com の Mechanical Turk サービスには、Web ブラウザ上で実行される Habitat シミュレーターを通じてアクセスでき、ユーザーは仮想ロボットをリモートで安全に操作できます。メタ氏は、得られたデータはAIエージェントが「最先端の結果」を達成するのに役立つトレーニング教材として役立つだろうと述べた。部屋をスキャンして全体的な空間特性を把握したり、角に障害物がないか確認したりすることは、すべて AI が人間から学ぶことができる効率的な物体検索動作です。

さらに、Meta AI チームは、独自の「ゼロサンプル体験学習フレームワーク」を通じて、ロボットがさまざまなセマンティックナビゲーションタスクとターゲットパターンを一般化できるようにする、いわゆる「プラグアンドプレイ」モジュールアプローチを開発しました。このようにして、AI エージェントは、リソースを大量に消費するマップやトレーニングなしで基本的なナビゲーション スキルを習得し、追加の調整なしで 3D 環境でさまざまなタスクを実行できるようになります。

Meta は、これらのエージェントがトレーニング中に画像オブジェクトを継続的に検索すると説明しています。環境内のランダムな場所で撮影された写真を受け取り、自律ナビゲーションを使用してその写真を探します。 Metaの研究者は、「私たちの方法はトレーニングデータを1/12.5に削減し、最先端の転移学習技術よりも成功率が14%高くなります」と述べています。

コンステレーション・リサーチのアナリスト、ホルガー・ミューラー氏はインタビューで、Metaの最新の進歩が同社のメタバース開発計画において重要な役割を果たすことが期待されると語った。彼は、将来仮想世界が標準になるとすれば、AI はこの新しい空間を理解できなければならず、理解にかかるコストは高すぎてはならないと考えています。

ミュラー氏はさらに、「AI の物理世界を理解する能力は、ソフトウェアベースのアプローチによって拡張される必要があります。Meta はこの道を歩み、具現化された AI の進歩を遂げ、トレーニングなしで周囲を理解できるソフトウェアを開発しています。この取り組みの早期の実際の応用を見るのが楽しみです」と付け加えました。

これらの実際の使用例は、そう遠くない将来に実現するかもしれません。 Meta 氏は、次のステップは、これらの進歩をナビゲーションからモバイル操作にまで進め、特定のタスク (財布を識別して所有者に返却するなど) を実行できる AI エージェントを開発することだと述べています。

<<:  Transformer 機械学習モデルとは何ですか?

>>:  5G悪報セキュリティ管理プラットフォームにおけるディープラーニングに基づくテキスト感情認識技術の応用

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

人工知能によって人々の仕事が失われることは確実だが、仕事がなくなることはないと言われているのはなぜでしょうか。

1956年に人工知能の概念が提案されて以来、人工知能と労働市場の関係については議論されてきました。...

中国移動研究所のチャン・ヤオビン氏:主流の人工知能技術スタックの詳細な議論と実践的な概要

はじめに:近年の人工知能技術の急速な発展は、主にニューラルネットワーク、チップ、ビッグデータという ...

もう終わりですか? LK-99は単なる強磁性体であり、超伝導体ではない。北京大学などの研究論文が発表された。

これまで、韓国における常温超伝導の再現に関する多くの研究で示された重要な指標は、常温常圧の条件下で、...

2019 年に注目すべき 11 の JavaScript 機械学習ライブラリ

ほとんどの機械学習は Python などの言語で行われますが、フロントエンドとバックエンドの両方にお...

中国科学院とディープマインドが協力し、ディープラーニングを使って脳が顔を認識する仕組みを解明

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

BBCはOpenAIによるデータスクレイピングをブロックしているが、ニュースでのAIの使用にはオープンである

英国最大の報道機関であるBBCは10月7日、ニュース、アーカイブ、「パーソナライズされた体験」の研究...

パンデミック下でIoTが「最前線で働く人」の役割を果たす

[[397252]]画像ソース: https://pixabay.com/images/id-594...

データサイエンスがソーシャルメディアマーケティング戦略をどう変えるか

人工知能の広範な応用は今日よく知られていますが、人工知能は具体的にどのように企業のソーシャル メディ...

ゲームにおけるディープラーニングと AI

[[190049]]この記事は、4月27日にBig Data Talk WeChatコミュニティで...

末期の病気を患う58歳の女性が、メタバースで死に際の願いを叶えた。VRグランドキャニオンツアーだ。

慢性閉塞性肺疾患を患っている女性は長い間病気で寝たきりの状態です。しかし、彼女の最後の願いは、アメリ...

ディープラーニングを活用してネットワークセキュリティを実現する方法

[[240276]]著者: ゲストブログ翻訳:張玲校正:丁南雅この論文では、ディープラーニングとそれ...

...

アルゴリズム学習のための動的プログラミング戦略の紹介

1. コンセプト動的プログラミング戦略、分割統治戦略。貪欲戦略と同様に、通常は最適解問題を解決するた...

AI 偽指紋が登場しても指紋ロック解除は安全ですか?

スマートフォンに生体認証指紋認証ロック解除技術が搭載されて以来、パスワードを入力する面倒なロック解除...