LiDARとTexas Instrumentsチップを搭載した最新のL3自動運転アーキテクチャの分析

LiDARとTexas Instrumentsチップを搭載した最新のL3自動運転アーキテクチャの分析

画像出典: インターネット

来年発売されるヒュンダイG90とGV80は、ヒュンダイのL3自動運転モデル​​となる。もちろん、L3自動運転はオプションだ。写真にはテストプロトタイプ車が写っており、2 つの LiDAR がはっきりと確認できます。

G90自動運転スパイ写真

画像出典: インターネット

韓国ソウルで撮影されたG90自動運転車のスパイ写真です。レーザーレーダーは後から追加されたようです。

レーザーレーダーを搭載したG90のスパイ写真

画像出典: インターネット

標準G90スパイ写真

画像出典: インターネット

現代自動車の世界販売台数は600万台以上を維持している。2020年の販売台数は12%減少したが、それでも635万台に達した。アライアンスではなく単一メーカーとしてカウントすると、現代自動車の販売台数は3位で、4位のゼネラルモーターズをわずかに上回る。そのため、現代自動車の自動運転は依然として注目に値する。

画像出典: インターネット

L3自動運転のセンサーレイアウトは上記の通りです。 LiDARに関して言えば、現代自動車の子会社である現代モービスはかつて、ベテランLiDAR企業であるベロダインに5000万ドルを投資し、ベロダインと共同で低価格のLiDARを開発・量産したことがある。現代モービスはベロダインのLiDARを外注していたが、そのプロセスは比較的遠かった。現代自動車はベロダインのLiDARではなく、より古いヴァレオLiDAR、第2世代のスカラを選択した。

画像出典: インターネット

より詳細なパラメータは次のとおりです。

画像出典: インターネット

有効距離のパラメータは、数百メートルとだけ言うほとんどのメーカーとは異なり、特に正確です。制限条件のないパラメータは意味がありません。正面では、デュアル LIDAR 用に特別に設計され、スキャン密度が向上しました。

画像出典: インターネット

L3 システムのコンピューティング アーキテクチャを上の図に示します。ほとんどのメーカーとは異なり、ヒュンダイのソリューションは低コストを目指しています。フロントビューカメラ FR CMR も、一般的なイーサネットや SerDes ではなく、CAN-FD バスを使用して接続されています。そのため、ピクセルは非常に低くする必要があり、150 万ピクセル以下と推定されます。 FR RDR は前方メインミリ波レーダー、FR C RDR と RR C RDR は 4 コーナーミリ波レーダーです。 FR C LDR LH は左側のレーザー レーダー、FR C LDR RH は右側のレーザー レーダーです。 CCIC は、中央制御と計器を統合したコックピット ディスプレイ画面です。CCU は実際には TCU であり、OTA アップグレードに使用されます。韓国語でマークされているものはデバッグ用であり、量産時には存在しません。 PHY は物理層チップで、おそらく Marvell の 88Q211 で、7 つの PHY を使用し、価格は約 105 ~ 140 米ドルです。 2 つのイーサネット スイッチ (おそらく Marvell の 88Q5050)。 MCUはInfineonのTC397XPですが、現在深刻な品不足に陥っています。

L3でありながら、電源系統が2系統あるデュアルシステム設計です。他のメーカーに変更すると、間違いなくL4だと言われます。右側のボックスがプライマリシステム、左側のボックスが緊急バックアップシステムです。実は3セットあって、自動駐車用に1セットあります。このシステムは、ヒュンダイとアプティブの合弁会社であるMotionalによって設計・製造される予定だ。

画像出典: インターネット

まずはバックアップシステムから見ていきましょう。CPUはIntelのDenverton、つまりAtom C3000シリーズです。C3000シリーズには16コアのモデルがC3950、C3955、C3958の3つしかありません。このうち、C3950 は TDP 電力がわずか 24 ワットと最も低く、C3958 は 31 ワット、C3955 は 32 ワットです。Hyundai は C3958 を選択する可能性が高いでしょう。 C3000シリーズは主に自動車分野ではなくIoT分野を対象としており、A3900シリーズは自動車分野を対象としています。ただし、この 2 つは非常に類似しており、どちらも Atom3000 シリーズに属します。 A3900 シリーズとは異なり、C3000 シリーズには GPU は搭載されておらず、CPU のみが搭載されています。 C3950 の現在の小売価格は約 160 ドルで、まとめ買いの場合は約 100 ドルになると推定されています。

4コア@2.0GHzのA3950のCPU演算能力は42160 DMIPSで、C3958は16コア@2.0GHzで演算能力は168.6Kになるはずで、Qualcommの5nm SA8295よりわずかに高いですが、C3958は14nmです。さらに、X86 のアウトオブオーダー実行能力は ARM よりもはるかに高くなっています。DMIPS は同等ですが、実際のパフォーマンスでは X86 の方が優れている場合がよくあります。 BMWのL3システムも、16コアと推定されるDenvertonを選択しました。従来のLIDAR ICPアルゴリズムでは、主にCPU出力に依存しているため、Denvertonが選択された理由かもしれません。

メインシステムのコアコンポーネントは、テキサス・インスツルメンツ社がADASと自動駐車用に発売したチップ「Texas Instruments TDA4VMID」です。現在、量産されているのはTDA4VMIDの1モデルのみです。2022年上半期にサンプルがリリースされる予定のモデルは他に2つあり、1つはTDA4VMID Plus、もう1つはTDA4VLowです。 1 つのチップの計算能力が不十分な場合は、4 つのチップを並列に接続できます。

画像出典: インターネット

2022年には、テキサス・インスツルメンツは同社の主力チップであるTDA4AHのサンプルも提供する予定だ。同チップは、100KDMIPSの演算能力を持つ8個の[email protected]、36TOPS@INT8の演算能力を持つ4個のMMA、320GFLOPSの演算能力を持つ4個のC7x DSPを搭載している。

TDA4VMID内部フレームワーク図

画像出典: インターネット

TDA4VMID は、約 25KDMIPS の計算能力を持つ 2 つの A72、8TOPS の計算能力を持つ 1 つの MMA、80GFLOPS の計算能力を持つ 1 つの C7x DSP、および 100GFLOPS の計算能力を持つ 1 つの GE8430 を使用します。ボードから判断すると、最新の L3 は 4 つの TDA4VMID を使用し、CPU の合計計算能力は 100K、NPU は 32TOPS になるはずで、これはかなり優秀です。

画像出典: インターネット

3 つの ARM Cortex-R5F リアルタイム ロックステップ システムにより、チップ全体が ASIL-D レベルに到達できます。

画像出典: インターネット

Vector によって開発された、基盤となる抽象化レイヤー MCAL に関連付けられた Autosar ドライバーがプリインストールされています。

画像出典: インターネット

ゲートウェイ、セーフティ アイランド、OTA、V2X、診断、IPC 通信など、KPIT が開発した AUTOSAR がプリインストールされています。

画像出典: インターネット

ディープラーニングに関しては、Texas Instruments 社は、Microsoft 社のオープン ニューラル ネットワーク エクスチェンジ ONNX を中心とした 3 つの主要な推論ディープラーニング モデルを最適化する TI Deep Learning (TIDL) を開発しました。ハードウェアの面では、DSP は MMA (行列乗算アクセラレータ) を追加します。

DSP は、ディープラーニングにおいて、NPU などのアクセラレータでは対応できない利点を持っています。つまり、DSP は、メモリ空間を 2 つに分割し、それぞれ命令とデータを格納するハーバード構造を採用しています。プロセッサ コアに接続された 2 セットのバスがあり、同時にアクセスでき、各メモリは独立してアドレス指定され、独立してアクセスされます。この配置により、プロセッサのデータ スループットが 2 倍になり、さらに重要なことに、データと命令の両方がプロセッサ コアに同時に提供されます。

このレイアウトにより、DSP はシングルサイクル MAC 命令を実装できます。 DSPを除いて、NPUは一般的にノイマンアーキテクチャを採用しています。データとプログラムはバスとストレージスペースを共有します。ディープラーニング推論の畳み込み演算では、1つの命令が同時に2つのオペランドを取ります。パイプライン処理中に、命令フェッチ操作もあります。プログラムとデータが1つのバスを介してアクセスされる場合、命令フェッチとデータフェッチは必然的に競合し、計算量の多いループの実行効率に非常に不利になります。

ハーバード構造は、基本的に命令フェッチと数値フェッチ間の競合問題を解決できます。ストレージのボトルネックがなく、自然にパイプライン化されたアーキテクチャです。結局、DSP のディープラーニング推論アクセラレーションの計算能力はほぼ膨らんでいるのに対し、NPU 専用のディープラーニング推論アクセラレーションは不安定で、ハードウェアとソフトウェアが統合された高度なカスタマイズが必要です。そのアーキテクチャ向けに開発されたあるモデルではアクセラレータの使用率は 90% ですが、別のモデルでは 10% や 5% にしかならないこともあります。たとえば、NVIDIA の Orin は理想的な計算能力が 254TOPS ですが、モデルによっては計算能力が 12.7TOPS まで低下します。実際には、ストレージのボトルネックを考慮すると、フォン・ノイマン・アーキテクチャのアクセラレータは理想値の 80% に到達できません。 DSP は汎用性が高く、どのモデルでも 90% の使用率を誇ります。

最新の L3 システムは、ディープラーニングの計算能力に依存せず、CPU と従来の決定論的かつ説明可能なアルゴリズムに依存しています。その信頼性は、ディープラーニングなどの不確実で説明不可能なアルゴリズムに依存する自動運転システムよりもはるかに高くなっています。

TDAV4MIDのビジュアルアクセラレーションパイプライン

画像出典: インターネット

<<:  自動運転システムのテストに関する簡単な説明

>>:  バイナリ検索アルゴリズムと時間計算量について簡単に説明し、バイナリ検索アルゴリズムを実装する

ブログ    
ブログ    

推薦する

美団における短編動画コンテンツ理解・生成技術の革新的実践

著者 |馬斌映像データに関しては、コンピュータビジョン技術を通じて関連データを活用し、ユーザーや企業...

蘇寧における知識抽出分野におけるディープラーニングの試みと実践

[[257470]] 【51CTO.comオリジナル記事】背景近年、膨大なデータの蓄積、計算能力の向...

速報です!ヒントンがロボットスタートアップに参入、同社は9000万ドルの新規投資を受ける

チューリング賞受賞者であり、ディープラーニングの父であるジェフリー・ヒントンの次の旅が決まりました。...

...

AI コンピューティング センター構築熱の背後で、お金を無駄にしているのは誰か?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

中国航空工業集団の「ドラゴンネスト」の初飛行は、電力検査のインテリジェント時代の幕開けを告げる

最近、北京市南六環路の北京延尊物流園区付近の安坊線70号塔の下で、中飛Avi Dragon Nest...

...

Cacti パーセンタイル監視アルゴリズム

Cactiパーセンテージ監視アルゴリズムの具体的な方法は次のとおりです。 cacti のテンプレート...

7つの機械学習アルゴリズムの7つの重要なポイント

さまざまなライブラリとフレームワークの助けを借りて、たった 1 行のコードで機械学習アルゴリズムを実...

1000ステップ未満の微調整で、LLaMAコンテキストは32Kに拡張されました。これは、Tian Yuandongチームの最新の研究です。

誰もが独自の大規模モデルをアップグレードして反復し続けるにつれて、コンテキスト ウィンドウを処理する...

21 世紀においてインテリジェント オートメーションは誇張されすぎているのでしょうか?

[[427549]] Analytics Insight では、21 世紀においてインテリジェント...

データサイエンスで勝つ: 製薬会社の幹部が始めるための 5 つのヒント

これら 5 つの重要なヒントは、製薬会社の幹部がデータ サイエンスの道への扉を開くのに役立つかもしれ...

...

...