見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

あるユーザーが Tesla FSD v12 のビデオをインターネットに投稿し、誰かがそれを Bilibili にアップロードしました。

https://www.bilibili.com/video/BV1Z6421M797www.bilibili.com/video/BV1Z6421M797

今回は、純粋に視覚的に作成するのが比較的難しいシーンでした。雨の日に地面に水があり、水に反射したさまざまなパターンによって奇妙な占有が生じる可能性があります。テスラは昨年 AI Day を開催しなかったため (競合他社は常に PPT をフレームごとに編集していたため、開催しなかったと言われている)、詳細な情報がない中で、ビデオからエンドツーエンドの機能の一部を垣間見ることができます。以下は、興味深い点のいくつかを分析したものです。

01:57、車のドアが開いていると誤って検知され、運転手は大きく迂回しました。

ここは大きな問題はありません。左側に比較的広いスペースがあるので、もう少し回り込んでも問題ありません。

02:09、OCCの誤検知により車がほぼ停止しました。

ここの歩行者は既に立ち去っていたので出発できましたが、地面には水がたくさんあり、それが地上の物体を反射して OCC が誤検知したため、再び出発する前にしばらく停止する必要がありました。

04:40、車両接近禁止命令により検査を通過できず

ここでは、左側の非常に近い距離で後退して割り込んできた車両を見逃しましたが、計画では発進の意図を伝えていなかったようです。これは、エンドツーエンドの大きな利点を反映しています。上流のエラーの結果が必ずしも誤った運転行動につながるわけではありません。後で同様の例をさらに見ていきます。

05:37 OCCの誤検出

これは、地面の水によって引き起こされた OCC である可能性があります。End-to-end はこの結果を信じて、ハンドルを左右に、時には左に、時には右に回しました。

05:48、左右近距離OCC誤検出

OCC の誤検知は、左右の非常に近いところで発生しました。それでもルールに従うのであれば、テイクオーバーを報告しなければならない可能性があります (必ずしもそうとは限りません。結局のところ、それらは運転軌道上にありません)。ここでは、これら 2 つの OCC を単に無視して運転を続けました。

06:57、前方近距離の歩行者誤検知

これは本当にすごいです。歩行者が目の前に現れた場合、すべてのルールベースの制御は急ブレーキをかけ、警報を鳴らしますが、エンドツーエンドのモデルは上流の結果を認識しず、通常どおり運転を続けます。

14点: 民間駐車場に閉じ込められ、脱出できない

これはBEVの認知距離不足の問題かもしれません。出口を見つけるのに時間がかかり、駐車場でうろついていました。 。

その他のクリップはすべて幹線道路での運転に関するものです。幹線道路では、FSD v12のパフォーマンスは非常にスムーズで、大きな問題はありません。特に夜間は、車線検出も非常に安定しています。ただし、ほとんどのメーカーがこのレベルを達成できると思うので、多くは語りません。

駐車場セクションだけ見ると、上流の結果を無視すれば、前方のOCC誤検知によりハンドルが左右に振れることを除けば、FSD v12の軌跡は比較的スムーズであり、エラーがあっても動揺することはなかった。歩行者、不規則に動く障害物(カート)、地面に水があるシーンでは、パフォーマンスは確かに良好です。

Tesla は、中間モジュールからの監視により、エンドツーエンドでマルチタスクを引き続き使用するため、フロントエンドでは obj det と occ の結果を表示できます。ただし、エンドツーエンドの規制と制御では、必ずしも上流の結果が採用されるわけではありません。近距離での検出漏れは必ずしも衝突を意味するわけではなく、近距離での誤検出は必ずしも停止を意味するわけではありません。すべての結果は、総合的な判断のために PNC に入力されます。これは確かに興味深い点です。確かなのは、マスク氏が嘘をついていないということです。これはまさにエンドツーエンドのシステムのパフォーマンスです。

<<:  実行に少量の計算リソースとメモリリソースしか必要としないSmall Llama大規模モデル

>>:  UniVision: BEV 検出と Occ、デュアル SOTA の統合フレームワーク!

ブログ    
ブログ    

推薦する

WAVE SUMMIT での Baidu Wang Haifeng: ディープラーニングが人工知能を産業大量生産に導入

「ディープラーニングは人工知能を大規模な工業生産の段階に押し上げています。ディープラーニングのフレー...

Ant Marketingの推奨シナリオにおける因果修正法

1. 因果修正の背景1. 逸脱の発生推奨システムは、収集されたデータに基づいて推奨モデルをトレーニン...

MIT の新しい研究: 労働者は AI によって排除されることを心配する必要はありません。コストは非常に高く、視覚的な作業の23%しか置き換えられない

人工知能は私たちの仕事を奪うのでしょうか?シリコンバレーの幹部が今日の最先端の AI テクノロジーに...

ロボット開発者イノベーションデー | Horizo​​n RDK と NodeHub の新製品

7月25日、「Horizo​​n 2023 Robotics Developer Innovatio...

...

新しい近似注意メカニズム HyperAttention: 長いコンテキストに適しており、LLM 推論が 50% 高速化します

トランスフォーマーは、自然言語処理、コンピューター ビジョン、時系列予測などの分野におけるさまざまな...

AI開発者の皆さん、こちらをお読みください: 主流のモバイルディープラーニングフレームワークの包括的なレビュー

PCと比較すると、モバイルデバイスは携帯性に優れており、普及率も高くなっています。近年、モバイルデバ...

人気のSoraはDiTを最前線に押し上げ、GitHubのホットリストにも載りました。新しいバージョンのSiTに進化しました。

リリースされてから1週間近く経ちますが、OpenAIの動画生成モデルSoraの衝撃はまだまだ続きます...

6000 以上の Web ページを閲覧した後、個人使用に最適な AI 製品のリストを選択しました。

[[220539]]リアム・ヘーネル編集者: Chaoxi、Yuanyuan、Harryこの記事で...

データ構造の8つの一般的なソートアルゴリズム

[[172688]]序文8 つのソート アルゴリズムと 3 つの検索アルゴリズムは、データ構造におけ...

中国語からSQLへの自動変換精度92%、このKaggleマスターが世界記録を更新

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

データガバナンスとビッグモデル統合の実践

コスト削減と効率向上の観点から、機械学習チームの構成を例に挙げ、Dipu TechnologyのDe...

顔認識の悪用は情報セキュリティ上の懸念を引き起こす

食べ物を注文した後、カメラをかざすだけで支払いが完了します。ホテルに宿泊する場合、顔をスキャンしない...

...

...