テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

数ヶ月沈黙していたテスラのヒューマノイドロボット、オプティマスプライムがついに新たな展開を見せた。私が最後にそれを見たのはテスラの株主総会、オプティマスが自由に歩いたり、柔軟に物をつかんだり置いたりするスキルを披露したときだったと覚えています。

今日、テスラ オプティマスは再び進化しました。今ではオブジェクトを自律的に分類できるようになりました。注目すべき点は、ニューラル ネットワークがビデオ入力、制御出力など、エンドツーエンドで完全にトレーニングされていることです。これは、すべての入力信号を処理して運転の決定を出力する、テスラの自動運転 FSD V12 の開発におけるニューラル ネットワーク トレーニングに似ています。

どうやってこれを実現するのかと問わずにはいられません。

オプティマスは腕と脚を自己調整する能力を備えており、視覚と関節位置エンコーダーのみを使用して、空間内で手足を正確に配置することができます。

正確なキャリブレーション機能により、Optimus はさまざまなタスクをより効率的に学習でき、ニューラル ネットワークは視覚のみを使用して完全にオンボードで実行されます。

これにより、Optimus は完全に自律的にオブジェクトを色別に分類できるようになります。

オプティマスは、誰かが妨害した場合でも、物体を色で正確に分類できます。

Optimus は、自律的に自己修正する (傾いた物体をまっすぐにする) 能力も実証しました。

トレーニング後には、分類されたオブジェクトのシャッフルなどの新しいタスクも実行できるようになります。

長い一日の「仕事」の後は、ストレッチをして手を合わせる時間です。

チームのシニア ソフトウェア エンジニアである Julian Ibarz 氏は、「チームがこの数か月で成し遂げた進歩を皆さんにお伝えできることを大変嬉しく思います。Optimus は、タスクにまったく依存しない方法でオブジェクトを自動的に分類するなど、長年の課題を解決できるようになりました。より多くのデータを収集するだけで、コードを変更することなく新しい複雑なタスクをトレーニングできます。」と述べています。

マスク氏もこの「進歩」を認めた。

ネットユーザーは衝撃を受けた一方で、オプティマスにタスクを実行させるためのプロンプトを入力することは可能なのかなど、いくつかの疑問も提起した。答えは「はい」です。ビデオでは、分類または分類解除のタスクを実行するために同じネットワークが使用されているので、Optimus に何をしたいかを伝えるだけです。

オプティマスの前世

Optimus は当初は物理的なロボットではありませんでした。「Tesla Bot」と呼ばれる一般的なロボット プロジェクトからゆっくりと孵化しました。

2021年、マスク氏は「Tesla AI Day」でTesla Botの一般的な外観を披露した。

テスラボットが動作をデモンストレーションしているときも、スタッフは特製のぴったりとした衣装を着て、ロボットに扮してダンスを披露した。しかし、そのようなアイデアは徐々に根付き、現実のものとなり、何度も画期的な進歩で人々を驚かせます。

1年後の「テスラAIデー」では、かつて人間が演じていたテスラボットがロボットのオプティマスに変身しました。

オプティマスがテスラAIデー2022で人々を迎える

新しく発表されたオプティマスはすでに箱を運んだり、花に水をやったり、工場で働いたりすることができる。しかし、これはオプティマスの最終目標ではありません。オプティマスは「脳」を持ったヒューマノイドロボットを目指しています。

オプティマスはテスラのギガファクトリーで働いている

マスク氏は、このロボットの設計にはわずか半年しかかからなかったと語り、今後の登場に大いに期待したいと述べた。

実際、2023年のテスラ株主総会では、オプティマスの足取りはより滑らかになり、動きもより巧みになった。

オプティマスは柔軟に物を掴んだり置いたりする

今、オプティマスは目標に向かって前進しており、「脳」を所有するための道筋はますます明確になりつつあります。次回どのように進化するか楽しみに待ちましょう。

<<:  MAmmoT により、LLM は形式論理と算術演算を学習する能力を備え、数学のジェネラリストになることができます。

>>:  ChatGPT Plus の一部加入者は、他のユーザーを無料トライアルに招待できますが、招待できるのは 1 回のみです。

ブログ    
ブログ    

推薦する

AI はデータセンターをよりスマートにするためにどのように役立ちますか?

[[383176]]今日、人工知能 (AI) は、これまで以上に高速にデータを収集、処理、分析する...

人工知能は一般的な仕事に取って代わるのでしょうか?心配しないで、この機会をつかんで次の10年をリードしてください

人工知能の急速な発展により、一連の新技術が誕生しました。ロボットはますます多くのことを人間に代わって...

小さなターゲットを検出するためのディープラーニングの一般的な方法

[[427475]]導入ディープラーニングによる物体検出、特に顔検出では、解像度が低い、画像がぼやけ...

機械学習開発ガイド(基礎編)

【51CTO.comオリジナル記事】序文機械学習は人工知能の分野で重要な部分を占めています。簡単に...

すべてのデータ サイエンティストに必要な 3 つのシンプルな異常検出アルゴリズム

外れ値検出の詳細と、Python で 3 つのシンプルで直感的かつ強力な外れ値検出アルゴリズムを実装...

...

研究によると、人工知能が書いたツイートに騙される可能性が高くなる

6月29日のニュースによると、新たな研究によると、人間が書いたツイートよりも、人工知能の言語モデルに...

AI と新しい小売業が出会ったとき、両者は力を合わせて無敵になれるのでしょうか?

[51CTO.com オリジナル記事] 2018 年に最も人気のある 2 つの単語はどれでしょうか...

ディープニューラルネットワークはディープフェイクを検出できる

開発者がディープフェイクのパンドラの箱を開けたことで、本物と区別がつかないほどリアルな写真を偽造する...

...

公共の安全を守るために都市に AI を導入するにはどうすればよいでしょうか?

[[347520]]今日私たちが直面している脅威の状況は絶えず変化しています。世界的に、法執行機関...

テキストマイニングからの分類、クラスタリング、情報抽出などのアルゴリズムのレビュー

テキストマイニングは、推奨システム、検索システム、その他の広範なアプリケーションなど、テキストマイニ...

...

海外メディア:科学者らが深海を探索できる魚のようなソフトロボットを設計

3月4日のニュース、外国メディアの報道によると、ネイチャー誌に最近発表された研究によると、中国のエン...

メタは世界最速となる可能性のあるAIスーパーコンピュータを開発

Metaによれば、AI Research SuperCluster(RSC)は企業がより優れたAI...