見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

あるユーザーが Tesla FSD v12 のビデオをインターネットに投稿し、誰かがそれを Bilibili にアップロードしました。

https://www.bilibili.com/video/BV1Z6421M797www.bilibili.com/video/BV1Z6421M797

今回は、純粋に視覚的に作成するのが比較的難しいシーンでした。雨の日に地面に水があり、水に反射したさまざまなパターンによって奇妙な占有が生じる可能性があります。テスラは昨年 AI Day を開催しなかったため (競合他社は常に PPT をフレームごとに編集していたため、開催しなかったと言われている)、詳細な情報がない中で、ビデオからエンドツーエンドの機能の一部を垣間見ることができます。以下は、興味深い点のいくつかを分析したものです。

01:57、車のドアが開いていると誤って検知され、運転手は大きく迂回しました。

ここは大きな問題はありません。左側に比較的広いスペースがあるので、もう少し回り込んでも問題ありません。

02:09、OCCの誤検知により車がほぼ停止しました。

ここの歩行者は既に立ち去っていたので出発できましたが、地面には水がたくさんあり、それが地上の物体を反射して OCC が誤検知したため、再び出発する前にしばらく停止する必要がありました。

04:40、車両接近禁止命令により検査を通過できず

ここでは、左側の非常に近い距離で後退して割り込んできた車両を見逃しましたが、計画では発進の意図を伝えていなかったようです。これは、エンドツーエンドの大きな利点を反映しています。上流のエラーの結果が必ずしも誤った運転行動につながるわけではありません。後で同様の例をさらに見ていきます。

05:37 OCCの誤検出

これは、地面の水によって引き起こされた OCC である可能性があります。End-to-end はこの結果を信じて、ハンドルを左右に、時には左に、時には右に回しました。

05:48、左右近距離OCC誤検出

OCC の誤検知は、左右の非常に近いところで発生しました。それでもルールに従うのであれば、テイクオーバーを報告しなければならない可能性があります (必ずしもそうとは限りません。結局のところ、それらは運転軌道上にありません)。ここでは、これら 2 つの OCC を単に無視して運転を続けました。

06:57、前方近距離の歩行者誤検知

これは本当にすごいです。歩行者が目の前に現れた場合、すべてのルールベースの制御は急ブレーキをかけ、警報を鳴らしますが、エンドツーエンドのモデルは上流の結果を認識しず、通常どおり運転を続けます。

14点: 民間駐車場に閉じ込められ、脱出できない

これはBEVの認知距離不足の問題かもしれません。出口を見つけるのに時間がかかり、駐車場でうろついていました。 。

その他のクリップはすべて幹線道路での運転に関するものです。幹線道路では、FSD v12のパフォーマンスは非常にスムーズで、大きな問題はありません。特に夜間は、車線検出も非常に安定しています。ただし、ほとんどのメーカーがこのレベルを達成できると思うので、多くは語りません。

駐車場セクションだけ見ると、上流の結果を無視すれば、前方のOCC誤検知によりハンドルが左右に振れることを除けば、FSD v12の軌跡は比較的スムーズであり、エラーがあっても動揺することはなかった。歩行者、不規則に動く障害物(カート)、地面に水があるシーンでは、パフォーマンスは確かに良好です。

Tesla は、中間モジュールからの監視により、エンドツーエンドでマルチタスクを引き続き使用するため、フロントエンドでは obj det と occ の結果を表示できます。ただし、エンドツーエンドの規制と制御では、必ずしも上流の結果が採用されるわけではありません。近距離での検出漏れは必ずしも衝突を意味するわけではなく、近距離での誤検出は必ずしも停止を意味するわけではありません。すべての結果は、総合的な判断のために PNC に入力されます。これは確かに興味深い点です。確かなのは、マスク氏が嘘をついていないということです。これはまさにエンドツーエンドのシステムのパフォーマンスです。

<<:  実行に少量の計算リソースとメモリリソースしか必要としないSmall Llama大規模モデル

>>:  UniVision: BEV 検出と Occ、デュアル SOTA の統合フレームワーク!

ブログ    
ブログ    
ブログ    

推薦する

...

運試しに自撮りしてみませんか?これはすべて顔認識技術のおかげです

新年の初めに、酉年の運勢を計算することは、多くの若者が夕食後に好んで行うことです。 「占い」はどちら...

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

先日、人工知能技術の可能性とそれに対する人々の懸念について語った際、人工知能研究会社OpenAIのC...

ASP.NET データ暗号化を実現する対称暗号化アルゴリズム

対称暗号化アルゴリズムはどのようにして ASP.NET データ暗号化を実装するのでしょうか?それでは...

産業用AIが製造業に革命を起こす5つの方法

人工知能 (AI) は、製造業において総合設備効率 (OEE) と生産時の初回歩留まりを向上させるた...

一般的な基本的なソートアルゴリズムを今回から理解しましょう

[[383742]]この記事はWeChatの公開アカウント「Beta Learns JAVA」から転...

...

ChatGPTを使用してPythonクローラースクリプトを自動的に作成する

人工知能チャットボット「ChatGPT」は最近非常に人気が高まっており、あらゆるメディアでそのニュー...

...

OpenAIは、レビューの効率を向上させ、人間の関与を減らすことができるコンテンツレビュー機能をテストしている。

人工知能のスタートアップ企業OpenAIは8月16日、GPT-4がコンテンツレビュー機能をテストして...

...

毎日のアルゴリズム: バランスのとれた二分木

[[426529]]この記事はWeChatの公開アカウント「3分でフロントエンドを学ぶ」から転載した...

ディープラーニング プラットフォームとして、TPU、GPU、CPU のどれが優れているでしょうか?誰かがベンチマーク調査を行った

GPU、TPU、CPU はすべてディープラーニング モデルのトレーニングに使用できますが、これらの各...

...

Giskard: AI モデル向けのオープンソース品質管理

翻訳者 |ブガッティレビュー | Chonglou実稼働環境で AI モデルの品質を確保することは複...