この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。
本稿では、鳥瞰図における近距離障害物認識を実現するための魚眼カメラと超音波センサーの融合について紹介します。正確な障害物認識は、自動運転の近距離認識範囲における基本的な課題です。従来、魚眼カメラは、後方障害物の位置特定を含む包括的な周囲認識によく使用されます。ただし、これらのカメラのパフォーマンスは、暗い場所、夜間、または強い日光にさらされると大幅に低下します。対照的に、超音波センサーなどの低コストのセンサーは、これらの条件の影響をほとんど受けません。したがって、本論文では、鳥瞰図 (BEV) での効率的な障害物認識のために魚眼カメラと超音波センサーを利用する初のエンドツーエンドのマルチモーダル融合モデルを提案します。当初、ResNeXt-50 は、各モダリティに固有の特徴を抽出するための単一モダリティ エンコーダーのセットとして採用されました。次に、可視スペクトルに関連付けられた特徴空間が BEV に変換されます。これら 2 つのモダリティの融合はカスケードによって実現されます。一方、超音波スペクトルに基づくユニモーダル特徴マップは、コンテンツ認識型拡張畳み込みを通じて、融合特徴空間内の 2 つのセンサー間のセンサーの不整合を軽減するために使用されます。最後に、融合された特徴は 2 段階セマンティック占有エンコーダーによって使用され、正確な障害物認識のためのグリッドごとの予測が生成されます。本論文では、2 つのセンサーのマルチモーダル融合の最適な戦略を決定するための体系的な研究が行われます。この記事では、データセットの作成プロセス、注釈のガイドライン、包括的なデータ分析について詳しく説明し、すべてのシナリオが適切にカバーされるようにします。私たちのデータセットに適用すると、提案されたマルチモーダル融合方法の堅牢性と有効性が実証されます。 この論文の主な貢献
オリジナルリンク: https://mp.weixin.qq.com/s/B0zQZ2_SapKuynG2qis1ug |
<<: EfficientViT-SAM: 精度を変えずにその場で離陸!
>>: AI を使って現実世界の問題を解決する 13 の Web3 プロジェクト
[51CTO.com クイック翻訳] 現在、人工知能技術が「悪のロボット」に発展し、世界を支配するの...
まず、ドローンはソレイマニの暗殺に使用され、その後、アルメニアとアゼルバイジャンの戦場でドローンが活...
[[397024]]ドメイン一般化 (DG) は近年非常に人気のある研究方向となっています。研究す...
[[424946]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
「1セット100元で、身分証明書の表裏の写真、身分証明書を持っている写真、うなずいたり首を振ったり口...
スマートな葬儀は常に議論の的となっている話題です。現状では、スマート葬儀サービスの応用製品にはまだま...
人工知能(AI)の最悪のシナリオは、ハリウッドの大ヒット映画でおなじみのものだ。人間のような知性と知...
[[313367]]テスラのエンジニアたちは、データの拡大に伴ってエンジニアの数を増やすことなく、...
[[242968]] #TensorFlow に基づく強化学習フレームワークDopamine は、強...