カリフォルニア大学バークレー校の新しい研究によると、ロボットはビデオ認識技術を通じて物体を移動させる前に何が起こるかを「予見」し予測する能力も持つことができるという。 人間には行動する前に考える能力がある。たとえば、ボールを蹴りたい場合、ボールがどこに行くか、そしてボールを新しい場所に蹴る確率を考慮するかもしれません。ロボットは、通常、単純なタスクのみを実行するようにプログラムされており、特に人工知能プログラムを搭載していないロボットでは、この能力が欠けていることがよくあります。 しかし、カリフォルニア大学バークレー校の研究者たちは、ロボットにもこの直感があることを発見した。これを実証するために、研究者らはロボットが先を見越して「これまで遭遇したことのない物体の操作方法を見つけ出す」ことを可能にする新しいロボット学習技術を開発した。 研究チームはこの技術を「視覚的先見」と呼んでいるが、少なくとも現時点では、ロボットが未来を予測する能力を持っているわけではない。 バークレーの研究者たちはこの技術を「Vestri」と呼ばれるロボットに適用し、ロボットのカメラが数秒後に見るものを予測できるようにした。新しいビジョンにより、Vestri は近くにある他の物体に触れることなく、テーブルの上で小さな物体を移動させることができます。最も驚くべきことは、この技術により、ロボットは人間の指導や監督、あるいは物理学の知識がなくても、これらの小さなタスクを実行できるようになることです。 「私たちが周囲の環境で行動するのと同じように、このアプローチにより、ロボットはさまざまな行動が周囲の世界にどのような影響を与えるかを視覚化できます」と、バークレー校の電気工学およびコンピューターサイエンスの助教授で共著者のジル・レヴィン氏は言う。「これにより、複雑な現実世界の環境で非常に柔軟なスキルをインテリジェントに計画できるようになります。」 Visual Foresight の基礎は、「畳み込み再帰ビデオ予測」、つまり動的ニューラル移流 (DNA) です。研究チームによれば、DNAベースのモデルは、ロボットの動作に基づいて、画像内のピクセルが1つのフレームから別のフレームにどのようにジャンプするかを予測できるという。ヴェストリのようなロボットは、今では「さまざまな視覚的物体操作能力を完全に独力で習得できる」と、レバイン研究室の博士課程の学生で、オリジナルの DNA モデルの発明者でもあるチェルシー・ファイン氏は説明する。 レバイン研究室のフェデリコ・アルベルト氏は、このロボットの動作を、人間が周囲の物体とやりとりする方法と比較した。 「人間は生涯を通じて、さまざまな物体と何百万回もやり取りすることで、教師なしで操作スキルを習得します」とアルバート氏は言う。「私たちは、自動的に収集された大量のデータを使用して、幅広く応用可能な操作能力、特に物体を押す能力を学習できるロボットシステムを開発できることを示しました。」 レビン氏は、ヴェストリの能力にはまだいくつかの限界があるが、技術を向上させるためにさらなる措置が講じられるだろうと指摘した。この技術は将来、自動運転車が新しい環境や未知の物体にうまく対応できるようになるかもしれない。 しかし、この目標を達成するには、より洗練されたビデオ予測や手法を組み込むなど、テクノロジーにはまだ多くの改善が必要です。将来のロボットは、同様の技術を使用して、物体を拾い上げて置いたり、衣服やロープなどの柔らかくて変形しやすい物体を扱ったりするなど、より複雑なタスクを実行できるようになるかもしれません。この推測に基づくと、洗濯機には将来、衣類を折りたたむという追加機能が搭載されるようになるかもしれません。 |
>>: 率直に言って、2018年に私たちが耐えなければならないかもしれない人工知能の暗い側面
米国現地時間7月6日水曜日、人工知能の新興企業OpenAIは、「超知能」人工知能システムを誘導・制御...
数日前、OpenAIはDALL·E 3をリリースしたばかりで、ビジュアルイメージは再び新たな段階に上...
人工知能の急速な発展により、一連の新技術が誕生しました。ロボットはますます多くのことを人間に代わって...
GPT-3.5が海外で発売されてからまだ1年も経っていないし、文心易言が国内で発売されてからまだ半...
アジア太平洋地域では、スマートホーム技術の登場により、ヘルスケア業界の大きな変革が起こっています。こ...
[[238546]]目は魂の窓です。科学者たちは、目の動きを通じて「心を読む」ことができる人工知能を...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
著者の劉玉樹氏は中国人民大学重陽金融研究所学務委員会委員、マクロ研究部部長、研究者である。本稿は11...
Huawei が初めて AIoT 戦略を発表したり、JD.com が IoT 事業を Xiaojin...
2月28日、Adweekは、Googleがいくつかの出版社と、ニュースコンテンツを作成するための新...
静かに、アルパカファミリーの“最強バージョン”が登場! GPT-4と同等のコンテキスト長32,000...