アメリカの科学者が新技術を開発：ロボットが行動する前によく考えさせる

カリフォルニア大学バークレー校の新しい研究によると、ロボットはビデオ認識技術を通じて物体を移動させる前に何が起こるかを「予見」し予測する能力も持つことができるという。

人間には行動する前に考える能力がある。たとえば、ボールを蹴りたい場合、ボールがどこに行くか、そしてボールを新しい場所に蹴る確率を考慮するかもしれません。ロボットは、通常、単純なタスクのみを実行するようにプログラムされており、特に人工知能プログラムを搭載していないロボットでは、この能力が欠けていることがよくあります。

しかし、カリフォルニア大学バークレー校の研究者たちは、ロボットにもこの直感があることを発見した。これを実証するために、研究者らはロボットが先を見越して「これまで遭遇したことのない物体の操作方法を見つけ出す」ことを可能にする新しいロボット学習技術を開発した。

研究チームはこの技術を「視覚的先見」と呼んでいるが、少なくとも現時点では、ロボットが未来を予測する能力を持っているわけではない。

バークレーの研究者たちはこの技術を「Vestri」と呼ばれるロボットに適用し、ロボットのカメラが数秒後に見るものを予測できるようにした。新しいビジョンにより、Vestri は近くにある他の物体に触れることなく、テーブルの上で小さな物体を移動させることができます。最も驚くべきことは、この技術により、ロボットは人間の指導や監督、あるいは物理学の知識がなくても、これらの小さなタスクを実行できるようになることです。

「私たちが周囲の環境で行動するのと同じように、このアプローチにより、ロボットはさまざまな行動が周囲の世界にどのような影響を与えるかを視覚化できます」と、バークレー校の電気工学およびコンピューターサイエンスの助教授で共著者のジル・レヴィン氏は言う。「これにより、複雑な現実世界の環境で非常に柔軟なスキルをインテリジェントに計画できるようになります。」

Visual Foresight の基礎は、「畳み込み再帰ビデオ予測」、つまり動的ニューラル移流 (DNA) です。研究チームによれば、DNAベースのモデルは、ロボットの動作に基づいて、画像内のピクセルが1つのフレームから別のフレームにどのようにジャンプするかを予測できるという。ヴェストリのようなロボットは、今では「さまざまな視覚的物体操作能力を完全に独力で習得できる」と、レバイン研究室の博士課程の学生で、オリジナルの DNA モデルの発明者でもあるチェルシー・ファイン氏は説明する。

レバイン研究室のフェデリコ・アルベルト氏は、このロボットの動作を、人間が周囲の物体とやりとりする方法と比較した。

「人間は生涯を通じて、さまざまな物体と何百万回もやり取りすることで、教師なしで操作スキルを習得します」とアルバート氏は言う。「私たちは、自動的に収集された大量のデータを使用して、幅広く応用可能な操作能力、特に物体を押す能力を学習できるロボットシステムを開発できることを示しました。」

レビン氏は、ヴェストリの能力にはまだいくつかの限界があるが、技術を向上させるためにさらなる措置が講じられるだろうと指摘した。この技術は将来、自動運転車が新しい環境や未知の物体にうまく対応できるようになるかもしれない。

しかし、この目標を達成するには、より洗練されたビデオ予測や手法を組み込むなど、テクノロジーにはまだ多くの改善が必要です。将来のロボットは、同様の技術を使用して、物体を拾い上げて置いたり、衣服やロープなどの柔らかくて変形しやすい物体を扱ったりするなど、より複雑なタスクを実行できるようになるかもしれません。この推測に基づくと、洗濯機には将来、衣類を折りたたむという追加機能が搭載されるようになるかもしれません。

<<: AIとビッグデータ2017「成長痛」

>>: 率直に言って、2018年に私たちが耐えなければならないかもしれない人工知能の暗い側面

テクノロジー企業史上初：MetaがGPT3パラメータサイズのAIモデルをオープンソース化

ブログ

シリコンバレーの大物たちが、ビッグモデルをオープンソース化すべきかどうかを議論している。一方は科学の進歩について語り、もう一方は米国の安全保障について語っている。

ブログ

アメリカの科学者が新技術を開発：ロボットが行動する前によく考えさせる

テクノロジー企業史上初：MetaがGPT3パラメータサイズのAIモデルをオープンソース化

Nokelockの「1+2」戦略は、スマートロックを商業利用の新時代へと導きます

人工知能の登場により、一人暮らしの高齢者の介護は難しくなくなり、高齢者介護はテクノロジーの時代に入った

PNASの新研究：ケンブリッジの学者らは、一部のAIモデルは計算できないことを発見した

アルゴリズムの時間計算量分析: Big O 表記

将来、人工知能ロボットに置き換えられる可能性のある10の仕事

シリコンバレーの大物たちが、ビッグモデルをオープンソース化すべきかどうかを議論している。一方は科学の進歩について語り、もう一方は米国の安全保障について語っている。

推薦する

OpenAI、「超知能」AIを制御するための新チームを発表

DALL·E 3のベンチマーク！メタ最強の文豪エミュの技術レポートを公開

人工知能は一般的な仕事に取って代わるのでしょうか？心配しないで、この機会をつかんで次の10年をリードしてください

企業が大型モデルに「参入」する場合、なぜ大手メーカーによる生産が推奨されるのでしょうか?

ヘルスケアの革命: アジア太平洋地域におけるスマートホーム技術の台頭

人工知能はあなたの目を見るだけであなたの性格を理解できる

ロボットに25分で6つの動作を学習させるトレーニング、バークレーは効率的なロボット操作フレームワークを開発

劉玉樹：人工知能における中国と米国の格差は縮まっているが、まだやるべきことはある

AIoTの生死に関わる状況：将来的にはAIoTは非常に収益性が高いが、現時点ではAI+IoTは非常に高価

Googleは、ニュースコンテンツを作成するために生成AIツールを使用するためにいくつかの出版社と提携していると報じられている。

最強のLLaMAが突如降臨！ハイパーパラメータを 1 つだけ変更するだけで、32,000 個のコンテキストトークンを達成し、複数のタスクで ChatGPT と Claude 2 を上回ることができます。