テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

数ヶ月沈黙していたテスラのヒューマノイドロボット、オプティマスプライムがついに新たな展開を見せた。私が最後にそれを見たのはテスラの株主総会、オプティマスが自由に歩いたり、柔軟に物をつかんだり置いたりするスキルを披露したときだったと覚えています。

今日、テスラ オプティマスは再び進化しました。今ではオブジェクトを自律的に分類できるようになりました。注目すべき点は、ニューラル ネットワークがビデオ入力、制御出力など、エンドツーエンドで完全にトレーニングされていることです。これは、すべての入力信号を処理して運転の決定を出力する、テスラの自動運転 FSD V12 の開発におけるニューラル ネットワーク トレーニングに似ています。

どうやってこれを実現するのかと問わずにはいられません。

オプティマスは腕と脚を自己調整する能力を備えており、視覚と関節位置エンコーダーのみを使用して、空間内で手足を正確に配置することができます。

正確なキャリブレーション機能により、Optimus はさまざまなタスクをより効率的に学習でき、ニューラル ネットワークは視覚のみを使用して完全にオンボードで実行されます。

これにより、Optimus は完全に自律的にオブジェクトを色別に分類できるようになります。

オプティマスは、誰かが妨害した場合でも、物体を色で正確に分類できます。

Optimus は、自律的に自己修正する (傾いた物体をまっすぐにする) 能力も実証しました。

トレーニング後には、分類されたオブジェクトのシャッフルなどの新しいタスクも実行できるようになります。

長い一日の「仕事」の後は、ストレッチをして手を合わせる時間です。

チームのシニア ソフトウェア エンジニアである Julian Ibarz 氏は、「チームがこの数か月で成し遂げた進歩を皆さんにお伝えできることを大変嬉しく思います。Optimus は、タスクにまったく依存しない方法でオブジェクトを自動的に分類するなど、長年の課題を解決できるようになりました。より多くのデータを収集するだけで、コードを変更することなく新しい複雑なタスクをトレーニングできます。」と述べています。

マスク氏もこの「進歩」を認めた。

ネットユーザーは衝撃を受けた一方で、オプティマスにタスクを実行させるためのプロンプトを入力することは可能なのかなど、いくつかの疑問も提起した。答えは「はい」です。ビデオでは、分類または分類解除のタスクを実行するために同じネットワークが使用されているので、Optimus に何をしたいかを伝えるだけです。

オプティマスの前世

Optimus は当初は物理的なロボットではありませんでした。「Tesla Bot」と呼ばれる一般的なロボット プロジェクトからゆっくりと孵化しました。

2021年、マスク氏は「Tesla AI Day」でTesla Botの一般的な外観を披露した。

テスラボットが動作をデモンストレーションしているときも、スタッフは特製のぴったりとした衣装を着て、ロボットに扮してダンスを披露した。しかし、そのようなアイデアは徐々に根付き、現実のものとなり、何度も画期的な進歩で人々を驚かせます。

1年後の「テスラAIデー」では、かつて人間が演じていたテスラボットがロボットのオプティマスに変身しました。

オプティマスがテスラAIデー2022で人々を迎える

新しく発表されたオプティマスはすでに箱を運んだり、花に水をやったり、工場で働いたりすることができる。しかし、これはオプティマスの最終目標ではありません。オプティマスは「脳」を持ったヒューマノイドロボットを目指しています。

オプティマスはテスラのギガファクトリーで働いている

マスク氏は、このロボットの設計にはわずか半年しかかからなかったと語り、今後の登場に大いに期待したいと述べた。

実際、2023年のテスラ株主総会では、オプティマスの足取りはより滑らかになり、動きもより巧みになった。

オプティマスは柔軟に物を掴んだり置いたりする

今、オプティマスは目標に向かって前進しており、「脳」を所有するための道筋はますます明確になりつつあります。次回どのように進化するか楽しみに待ちましょう。

<<:  MAmmoT により、LLM は形式論理と算術演算を学習する能力を備え、数学のジェネラリストになることができます。

>>:  ChatGPT Plus の一部加入者は、他のユーザーを無料トライアルに招待できますが、招待できるのは 1 回のみです。

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

なぜロボット起業のチャンスはBサイドにあると言われるのでしょうか?

技術の変化のスピードは常に保守派の想像を超えています。 [[348702]]多くの人々の直感では、過...

ZTouch創設チーム:私たちの価値観を守り、新世代のグローバル企業のデジタルインテリジェンスパートナーになる

今日のデジタル時代では、顧客獲得の方法はよりシンプルになりましたが、さまざまなプラットフォームでの煩...

AI時代に向けてキャリアを再設計する時が来た

Pew Researchの分析によると、AI、特にAIGCの台頭は管理職や専門職に大きな影響を与える...

...

...

...

SQL Server 2008 の 9 つのデータ マイニング アルゴリズム

1. 決定木アルゴリズム決定木は判断木とも呼ばれ、バイナリ ツリーやマルチ ブランチ ツリーに似たツ...

人工知能の舞台裏:マイクロソフトとOpenAIのスーパーコンピューターはアイオワ州で大量の水を消費している

9月10日、マイクロソフトとOpenAIが共同開発した人工知能システム「ChatGPT」のトレーニ...

GenAI が CIO にとって悪夢である理由とその解決方法

GenAI が現代の企業にとって非常に魅力的な理由は理解できます。これは、世界中のさまざまな業界で無...

人工知能は感情を認識するために使われている

感情認識技術は、人工知能を使用して人の表情から感情を検出する、数十億ドル規模の新興産業です。しかし、...

人工知能時代の未来の人材をどう育成するか?専門家や名門校の校長はこう言う

人工知能の時代、未来の人材をどう育成するか? 10日、2019年重慶人材大会第4回大学・高校教育発展...

...

...

AIoTの登場で人間の生活はどのように変化するのでしょうか?

AI と IoT という 2 つの優れたテクノロジーが融合すると、モノのインターネットの人工知能 ...