この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。 元のタイトル: ScalableMap: オンライン長距離ベクトル化 HD マップ構築のためのスケーラブル マップ学習 論文リンク: https://arxiv.org/pdf/2310.13378.pdf コードリンク: https://github.com/jingy1yu/ScalableMap 著者所属: 武漢大学 論文のアイデア:本稿では、オンボードカメラセンサーを使用してオンラインの長距離ベクトル化高精度 (HD) マップを構築するための新しいエンドツーエンドのパイプラインを提案します。高精度マップのベクトル化された表現では、ポリラインとポリゴンを使用してマップ要素を表し、下流のタスクで広く使用されています。しかし、動的オブジェクト検出を参照して設計された従来の方式では、線形マップ要素内の構造的制約が無視されるため、長距離シーンではパフォーマンスが低下します。この論文では、マップ要素の特性を利用してマップ構築のパフォーマンスを向上させます。本論文では、線形構造のガイダンスの下でより正確な鳥瞰図 (BEV) の特徴を抽出し、ベクトル化されたグラフ要素のスケーラビリティをさらに活用するための階層的スパース グラフ表現を提案し、この表現に基づいて漸進的デコード メカニズムと監視戦略を設計します。私たちの方法 ScalableMap は、nuScenes データセット、特に長距離シーンで優れたパフォーマンスを発揮し、18.3 FPS を達成しながら、以前の最先端モデルを 6.5 mAP 上回りました。 主な貢献:(i) この論文では、初のエンドツーエンドの長距離ベクトル化マップ構築パイプラインであるScalableMapを提案します。この論文では、マッピング要素の構造特性を利用してより正確な BEV 機能を抽出し、スケーラブルなベクトル化要素に基づく HSMR を提案し、それに応じてプログレッシブ デコーダーと監視戦略を設計します。これらすべてにより、優れた長距離地図認識が実現します。 (ii)ScalableMapのnuScenesデータセット[17]上でのパフォーマンスを評価するために広範な実験を実施しました。私たちが提案した方法は、長距離 HD マップ学習において最先端の結果を達成し、既存のマルチモーダル方法よりも 6.5 mAP 優れ、18.3 FPS を達成しました。 ネットワーク設計:この論文の目的は、ベクトル化された地図要素の構造特性を活用して、より長い距離にある地図要素を正確に検出するという課題に対処することです。まず、本論文では、2 つのブランチを通じてそれぞれ位置認識 BEV 特徴とインスタンス認識 BEV 特徴を抽出し、線形構造のガイダンスの下でそれらを融合してハイブリッド BEV 特徴を取得します。次に、本論文では、マップ要素をスパースかつ正確に抽象化する階層的スパース マップ表現 (HSMR) を提案します。この表現をDETR[16]が提案したカスケードデコード層と統合し、ベクトル化されたマッピング要素のスケーラビリティと漸進的な監視戦略を活用して構造化情報の制約を強制し、推論の精度を向上させる漸進的デコーダーを設計します。当社のソリューション ScalableMap は、マップのサンプリング密度を動的に増加させてさまざまなスケールの推論結果を取得し、より正確なマップ情報をより早く取得できるようにします。 図 1: ScalableMap の概要。 (a) 構造ガイド付きハイブリッド BEV 特徴抽出器。 (b) 階層的スパースマップ表現とプログレッシブデコーダー。 (c)漸進的な監督。 図 2: 進行性ポリライン損失の視覚化。 実験結果:引用: Yu, J., Zhang, Z., Xia, S., & Sang, J. (2023). ScalableMap: オンライン長距離ベクトル化 HD マップ構築のためのスケーラブル マップ学習。ArXiv. /abs/2310.13378 オリジナルリンク: https://mp.weixin.qq.com/s/7VIS0B_Qbq7bmHSj6RIxOg |
>>: Go-OpenAI を使用して ChatGPT を簡単に呼び出し、無限の創造性を解き放ちましょう。
現在、人間による自動運転シリーズの進捗状況はどうなっていますか? 最終エピソードが完成するまでにどれ...
この記事は、Google Brain エンジニアの Zhou Yuefeng 氏が QCon Sha...
Amazon Polly は、テキストをリアルな音声に変換するサービスです。これにより、音声を発する...
Frontier Insightsの今号では、VRで制御できるロボット プログラム、フル充電で消毒剤...
AppleがSiriを発表してから7年、そしてジェフ・ベゾスがスタートレックにインスピレーションを得...
農業は人類の生存の基盤であり、第三次産業の中核的位置を占め、経済社会の安定と発展に極めて重要な産業で...
機械学習の初心者であっても、中級プログラマーであっても、この質問に戸惑うかもしれません。チートシート...
「ビッグデータ」と「人工知能」はテクノロジー業界で最も価値のある分野となっている。Apple、Go...
近年、私たちの生活におけるドローンの応用はますます一般的になっています。当初は軍事分野でしたが、その...
各種の大規模モデルやディープニューラルネットワークの登場により、人工知能の発展に対応し、高い計算能力...
サイバー攻撃の性質と標的が多様化するにつれて、サイバーセキュリティの専門家が脆弱性に対処する方法を決...
機械学習におけるパフォーマンスを主張するために使用される指標については、ほとんど議論されていません。...