SupFusion: 香港中文大学の最新の LV 融合による 3D 検出用新 SOTA!

SupFusion: 香港中文大学の最新の LV 融合による 3D 検出用新 SOTA!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

元のタイトル: SupFusion: 3D オブジェクト検出のための教師あり LiDAR カメラ融合

論文リンク: https://arxiv.org/pdf/2309.07084.pdf

著者所属機関: NIO、香港中文大学

コードリンク: https://github.com/IranQin/SupFusion

会議: ICCV 2023

論文のアイデア

LiDARとカメラの融合による3次元検出は、自動運転を実現するための重要な技術の一つです。近年、多くの LiDAR カメラ融合方式が登場し、単一モダリティ検出器と比較して有望なパフォーマンスを実現していますが、融合プロセスの慎重な設計と効果的な監視が常に欠如しています。

本稿では、LiDAR とカメラの融合を効果的に行うための補助的な特徴レベルの監視を提供し、検出性能を大幅に向上させる新しいトレーニング戦略 SupFusion を提案します。私たちの戦略には、Polar Sampling と呼ばれるデータ拡張手法が採用されています。これは、スパース オブジェクトを暗号化し、補助モデルをトレーニングして、監視として高品質の機能を生成するものです。これらの特徴は、LiDAR カメラ融合モデルのトレーニングに使用され、融合された特徴は、生成された高品質の特徴をシミュレートするために最適化されます。さらに、本論文では、SupFusion 戦略に基づく既存の融合方法と比較して一貫して優れたパフォーマンスを発揮する、シンプルでありながら効果的なディープ融合モジュールを提案します。この論文で提案された方法には、次のような利点があると思われます。まず、SupFusion は補助的な特徴レベルの監視を導入し、追加の推論コストを導入することなく LiDAR カメラの検出パフォーマンスを向上させることができます。第二に、提案された深核融合により、検出器の能力を継続的に向上させることができます。本論文で提案されている SupFusion およびディープ フュージョン モジュールはプラグ アンド プレイであり、その有効性を実証するために多数の実験が行われています。具体的には、複数の LiDAR カメラ 3D 検出器に基づいて、この論文では KITTI ベンチマークで約 2% の 3D mAP の改善を実現しています。

主な貢献

本稿では、SupFusion という新しい教師あり融合トレーニング戦略を提案します。これは主に高品質の特徴生成プロセスで構成されており、私たちの知る限り、堅牢な融合特徴抽出と正確な 3D 検出を実現するために補助的な特徴レベルの監督損失を提案した初めての戦略です。

SupFusion で高品質の特徴を得るために、本論文では、極座標サンプリングを使用してスパース オブジェクトを暗号化するデータ拡張方法を提案します。さらに、本論文では、連続検出精度を向上させる効率的なディープフュージョンモジュールを提案しています。

我々は、異なる融合戦略を用いて複数の検出器で広範な実験を実施し、KITTI ベンチマークで約 2% の mAP 改善を達成しました。

ネットワーク設計

本論文では、高品質の特徴を生成し、融合および特徴抽出プロセスに効果的な監督を提供し、LiDAR カメラ融合に基づく 3D 検出のパフォーマンスをさらに向上させる、SupFusion という教師あり LiDAR カメラ融合方法を提案します。具体的には、まず高品質の機能を提供するために補助モデルをトレーニングします。この目標を達成するために、より大きなモデルや追加データを利用する従来の方法とは異なり、本論文では Polar Sampling と呼ばれる新しいデータ拡張方法を提案します。極座標サンプリングは、スパースな LIDAR データからオブジェクトの密度を動的に高め、オブジェクトの検出を容易にし、正確な検出結果につながる特徴などの特徴の品質を向上させることができます。次に、補助的な特徴レベルの監視を導入することで、LiDAR カメラ融合ベースの検出器をトレーニングします。このステップでは、生の LiDAR とカメラの入力を 3D/2D バックボーンと融合モジュールに送り、融合された機能を取得します。一方では、融合された特徴は、最終的な予測、つまり決定レベルの監視のために検出ヘッドに送られます。一方、補助的な監督は、事前にトレーニングされた補助モデルと強化された LiDAR データを通じて取得された、融合された特徴を高品質の特徴としてシミュレートします。このように、提案された特徴レベルの監視により、融合モジュールはより堅牢な特徴を生成し、検出パフォーマンスをさらに向上させることができます。 LiDAR とカメラの機能をより適切に融合するために、この論文では、スタックされた MLP ブロックと動的融合ブロックで構成されるシンプルでありながら効果的なディープ融合モジュールを提案します。 SupFusion は、ディープ フュージョン モジュールの機能を最大限に活用し、検出精度を継続的に向上させることができます。

図 2: 検出器のトレーニング プロセス。この論文では、与えられた LiDAR カメラ サンプルについて、対応する 3D/2D エンコーダーを通じて特徴表現を抽出し、提案されたディープ フュージョン モジュールを使用してマルチモーダル特徴を融合します。損失を検出するだけでなく  さらに、本論文では補助的な特徴レベルの監督を提案している。   、融合された特徴  高品質な機能をシミュレートする 補助モデルと拡張データによって生成されます。

図 3: 高品質な特徴生成プロセス。任意の LiDAR サンプルについて、データベースから照会された密なターゲットの方向と回転を計算し、貼り付けによって疎なターゲットに追加のポイントを追加する極座標貼り付けによって疎なターゲットを暗号化します。この論文では、まず強化されたデータを使用して補助モデルをトレーニングし、強化された LiDAR データを補助モデルに入力して、高品質の特徴を生成します。   収束するまで続けます。

図 1: 上部: 従来の LiDAR カメラ 3D 検出器。検出損失を介して融合モジュールを最適化します。下: この論文で提案された SupFusion。ここでは、補助モデルによって提供される高品質の機能を使用した補助的な監督を提案しています。

図 4: 極座標グループ化は、主に各クラスの方向と回転を含む極座標系で各グループの密なオブジェクトを格納するデータベースを構築することです。

実験結果

参考文献

Qin, Y., Wang, C., Kang, Z., Ma, N., Li, Z., & Zhang, R. (2023). SupFusion: 3D オブジェクト検出のための教師あり LiDAR カメラ融合。ArXiv. /abs/2309.07084

オリジナルリンク: https://mp.weixin.qq.com/s/-pPUtrlfeo_09svMxk2qFA

<<:  ロボットと人間:その組み合わせが産業オートメーションの様相を変える可能性

>>: 

ブログ    
ブログ    

推薦する

Linux の割り込み処理メカニズムを使用してシステムパフォーマンスを向上させる

Linux 割り込み処理メカニズムを使用すると、システム パフォーマンスが大幅に向上します。割り込み...

プライバシー保護を再構築するには、AIモデルに「あなたを忘れさせる」ことを早く行う必要がある

この時代において、プライバシーは長い間誤った主張となってきました。プライバシー保護をある程度回復する...

MITのコンピューターの先駆者ジョエル・モーゼス氏が死去! 50年前にコンピューターに微積分を教えた

コンピューターの専門家がまた一人亡くなりました! 著名なコンピューター科学者で、MITのコンピュータ...

AI音声アシスタントと仮想IP画像の組み合わせは、ブランドマーケティングの新たな名刺になるかもしれない

最近、世界インターネット会議で「世界インターネット発展報告書2020」が発表されました。報告書では、...

2020年のAIの7つの開発トレンド

[[320187]]追加の AI アプリケーションの需要が高まるにつれて、企業はデータ サイエンス ...

...

Huawei が積極的に攻勢をかけており、Google もすぐ後に続いています。人工知能をめぐるこの戦いに勝つのは誰だと思いますか?

[[244829]]テクノロジー大手のHuaweiは最近かなり活発に活動している。 9月1日、ファ...

ナレッジグラフは人気があります。今すぐ選んでみませんか。

[51CTO.comより引用] モバイルインターネットの発展に伴い、あらゆるものの相互接続が可能に...

彼女はマスクとビットコインへの多額の投資により伝説となった! 2021年のトップ10テクノロジートレンドを発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ターミネータースカイネット?国防総省は、敵の行動を数日前に予測できるAI予測システムGIDEをリリースした

[[415649]]最近、米国防総省は、大量の情報源を分析し、数日後の敵の行動を1分以内に予測し、事...

AIの限界を理解することがその可能性を実現する鍵となる

人工知能は多くの業界のワークフローを変革しました。デジタル顧客サービスアシスタント、自動運転車、無人...

機械学習を使用してデータセンターの電力を管理するにはどうすればよいでしょうか?

[[249391]] [51CTO.com クイック翻訳] データセンターがますます複雑になってい...

...

...

...