MIT は隠れた物体を「認識」できるロボットを開発中。「私たちはロボットに超人的な認識力を与えようとしている」

MIT は隠れた物体を「認識」できるロボットを開発中。「私たちはロボットに超人的な認識力を与えようとしている」

MITの研究者らは、視覚と無線周波数(RF)センシングを組み合わせて、視界から隠れている物体でも見つけてつかむことができるロボットを開発した。このテクノロジーは、電子商取引の倉庫タスクの実行に役立ちます。

近年、ロボットは人工視覚、触覚、さらには嗅覚を獲得しました。 「研究者たちはこれまでずっと、ロボットに人間のような知覚能力を与えようとしてきた」とMITの准教授ファデル・アディブ氏は語る。アディブ氏のチームは新しい論文で、この技術をさらに推し進めている。「私たちはロボットに超人的な知覚を与えようとしている」と同氏は語った。

研究者たちは、壁を通過できる電波を使って隠れた物体を感知するロボットを開発した。 「RF-Grasp」と呼ばれるこのロボットは、この強力な感知機能と従来のコンピュータービジョンを組み合わせて、障害物となる可能性のある物体を見つけて掴むことができます。この進歩により、将来的には倉庫での電子商取引の履行が効率化されるかもしれないし、機械が乱雑な工具バッグからドライバーを取り出すのを手助けするようになるかもしれない。

この研究は5月に開催されるIEEE国際ロボット工学・オートメーション会議で発表される予定だ。この論文の主著者は、MITメディアラボのシグナルダイナミクスグループの研究助手であるタラ・ボロウシャキ氏です。彼女の MIT の共著者には、信号ダイナミクス グループを率いる Adib 氏や、機械工学部の 1957 年卒の准教授 Alberto Rodriguez 氏などが含まれています。他の共著者には、ハーバード大学の研究エンジニアであるジュンシャン・レン氏と、ジョージア工科大学の博士課程の学生であるイアン・クレスター氏が含まれています。

電子商取引が成長を続ける中、時には危険な労働条件にもかかわらず、倉庫作業は一般的にロボットではなく人間の領域のままです。その理由の 1 つは、ロボットが混雑した環境で物体を見つけてつかむことが難しいためです。 「認識とピッキングは、今日の業界における2つの障害です」とロドリゲス氏は言う。「光学視覚だけでは、ロボットは箱に詰められた品物や棚の上の別の物の後ろに隠れた品物の存在を感知できません。もちろん、可視光線は壁を通り抜けることはできません。」

何十年もの間、無線周波数 (RF) 識別は図書館の本からペットまであらゆるものを追跡するために使用されてきました。 RFID システムには、リーダーとタグという 2 つの主要コンポーネントがあります。タグとは、追跡対象となるアイテムに取り付けられる、またはペットの場合はアイテムに埋め込まれる小さなコンピューター チップです。次に、リーダーは無線周波数信号を送信し、この信号はタグによって変調され、リーダーに反射されます。

反射信号は、タグ付けされたアイテムの位置と ID に関する情報を提供します。この技術はすでに小売サプライチェーンで普及しつつあり、日本は数年以内に小売購入のほぼすべてに無線追跡技術を使用することを目指している。研究者たちは、この無線周波数の氾濫がロボットに新たな認識モードを与え、ロボットにとって恩恵となる可能性があると気づいた。

「無線周波数は視覚とは異なる形の感知です」とロドリゲス氏は言う。「無線周波数で何ができるかを探らないのは間違いでしょう。」

RF-Grasp は、カメラと RF リーダーの両方を使用して、タグ付けされたオブジェクトがカメラの視野から完全に遮られている場合でも、そのオブジェクトを見つけて掴みます。グリッパーに接続されたロボットアームで構成されています。カメラはロボットの手首にあります。 RF リーダーはロボットから独立しており、追跡情報をロボットの制御アルゴリズムに渡します。したがって、ロボットは無線周波数追跡データと周囲の視覚画像を継続的に収集します。これら 2 つのデータ ストリームをロボットの意思決定に統合することは、研究者が直面している最大の課題の 1 つです。

「ロボットは、どのデータ ストリームを考慮するのがより重要かを常に判断する必要があります」と Boroushaki 氏は言います。「これは単なる目と手の協調ではなく、RF と目と手の協調です。そのため、問題は非常に複雑になります。」

ロボットは無線周波数タグに呼びかけることで対象物の位置を感知し、探索と把握のプロセスを開始します。 「まず無線周波数を使って視覚的な注意を集中させる」とアディブ氏は言う。 「その後、視覚を使って細かい操作を導きます。」この一連の動作は、背後から警報音が聞こえ、振り返って警報音がどこから聞こえているのかをより明確に把握する動作に似ています。

RF グラバーは、2 つの相補的な感覚により、ターゲット オブジェクトをロックします。ロボットが物体に近づき、物体を操作し始めると、無線周波数よりも細かい情報を提供する視覚がロボットの意思決定を支配するようになる。

RF-Grasp は一連のテストでその効率性を実証しました。カメラのみを搭載した同様のロボットと比較すると、RF-Grasp は全体の動きを約半分に抑えて、対象物を正確に見つけて掴むことができます。さらに、RF-Grasp は、目標に近づくために、周囲にある梱包材やその他の障害物を取り除き、周囲環境を「一掃」する独自の能力を実証しました。ロドリゲス氏は、これはRF-GraspがRFセンサーを貫通しないロボットに対して「不当な優位性」を持っていることを示唆していると述べた。 「他のシステムにはまったくないガイダンスが備わっています。」

RF-Grasp は将来、混雑した電子商取引倉庫でのフルフィルメントを可能にする可能性があります。無線周波数センシングにより、アイテムを操作したり、バーコードを露出させてスキャンしたりすることなく、アイテムの ID を瞬時に検証できます。 「無線周波数は、特に感知と測位の分野で産業界におけるいくつかの制限を改善する可能性を秘めている」とロドリゲス氏は語った。

アディブ氏はまた、IKEAの椅子を組み立てるのに適したレンチを見つけるなど、このロボットを家庭内で活用することも想定している。 「あるいは、このロボットが失くしたものを探しているところを想像してみてください。まるでスーパーロンバードが、私がどこに置いた鍵でも探しに行くようなものです。」

<<:  消防ドローンはあらゆる能力に優れていることから人気が高まっています!

>>:  図: ページ置換アルゴリズム

ブログ    
ブログ    
ブログ    

推薦する

25倍のパフォーマンス向上: RustはCとC++に取って代わり、機械学習のPythonバックエンドとして好まれるようになると期待されています。

機械学習開発の分野では、全体像を見て細かい詳細をすべて取り除くと、機械学習開発における不変の 2 つ...

AIは脳の信号をリアルタイムで解釈し、画像の主要な視覚的特徴を7倍の速度で復元するとルカン氏は述べた。

AIが脳の信号をリアルタイムで解釈できるようになりました!これはセンセーショナルなことではありませ...

...

今後の国内人工知能産業の発展における5つの大きなトレンド

現在、中国で人工知能の分野で最も多くの投資を受けている5つのサブセクターは、コンピュータービジョン(...

データから生成AIまで、リスクを再考する時が来ている

OpenAIの「宮廷闘争」ドラマはもうすぐ終わりを迎える。 CEOのサム・アルトマンは取締役会によっ...

学術界の巨人たちのブラックテクノロジー:人工知能のダークマターについて聞いたことがありますか?

北京大学の公式サイトの最新情報によると、元UCLA(カリフォルニア大学ロサンゼルス校)教授の朱松春...

...

この記事では、さまざまな教師なしクラスタリングアルゴリズムのPython実装について簡単に説明します。

教師なし学習は、データ内のパターンを見つけるために使用される機械学習技術の一種です。教師なし学習アル...

Lilith モバイルゲームにおける不正防止の設計と調査

1. モバイルゲーム闇産業チェーンまず、モバイルゲームのブラック産業チェーンを紹介します。これは基本...

...

OpenAI研究者:データが不十分な場合に教師あり学習を実現する方法

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

モデルが大きくなればなるほど、パフォーマンスは向上しますか? Appleの自己回帰視覚モデルAIM: そうです

過去数年間、大規模な事前トレーニング済みモデルが NLP の分野で成功を収めてきました。このようなモ...

ガートナー 2019 人工知能成熟サイクルのトレンド

このガートナーのハイプサイクルは、AIが企業に及ぼすさまざまな影響を強調しています。ガートナーの 2...

...

時代と戦う:ハードコアな百度の AI 探究

2021年2月18日午前、百度は2020年第4四半期および通期の財務報告を発表し、印象的なデータを示...