AmodalSynthDrive: 自動運転のための合成アモーダル知覚データセット

AmodalSynthDrive: 自動運転のための合成アモーダル知覚データセット

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

  • 論文リンク: https://arxiv.org/pdf/2309.06547.pdf
  • データセットリンク: http://amodalsynthdrive.cs.uni-freiburg.de

まとめ

この論文では、自動運転のための合成アモーダル知覚データセットである AmodalSynthDrive を紹介します。部分的に遮蔽されていても物体の全体を問題なく推定できる人間とは異なり、現代のコンピューター ビジョン アルゴリズムでは、この点が依然として非常に困難です。自動運転にこのタイプのモダリティフリー知覚を活用することは、適切なデータセットが不足しているため、ほとんど未開拓のままです。これらのデータセットの生成は、主に、高額な注釈コストと、遮蔽された領域に正確に注釈を付ける際の注釈者の主観によって引き起こされる干渉を軽減する必要性によって影響を受けます。これらの制限に対処するために、本論文では、合成マルチタスク非モーダル知覚データセットである AmodalSynthDrive を紹介します。このデータセットには、さまざまな交通、天候、照明条件下での 100 万を超えるオブジェクト注釈を含む、150 の運転シーケンスのマルチビュー カメラ画像、3D 境界ボックス、LIDAR データ、オドメトリが含まれています。 AmodalSynthDrive は、空間理解を強化するためのアモーダル深度推定の導入など、さまざまなアモーダルシーン理解タスクをサポートします。課題を明らかにするために、各タスクのいくつかのベースラインを評価し、パブリック ベンチマーク サーバーをセットアップします。

主な貢献

この論文の貢献は次のように要約されます。

1) 本論文では、複数のデータソースを持つ市街地運転シナリオ向けの包括的な合成アモーダル知覚データセットである AmodalSynthDrive データセットを提案します。

2) アモーダル知覚タスクのベンチマーク、すなわちアモーダルセマンティックセグメンテーション、アモーダルインスタンスセグメンテーション、アモーダルパノプティックセグメンテーションを提案する。

3) 新しい非モーダル深度推定タスクは、空間理解の向上を促進することを目的としています。私たちは、いくつかのベースラインを通じてこの新しいタスクの実現可能性を実証します。

紙の図表








要約する

知覚は自動運転車にとって非常に重要なタスクですが、現在のアプローチでは、複雑な交通シナリオを解釈するために必要な非モーダル理解がまだ欠けています。この目的のために、本論文では、自動運転のためのマルチモーダル合成知覚データセットである AmodalSynthDrive を提案します。合成画像と LiDAR ポイント クラウドを使用して、基本的なアモーダル知覚タスクのグラウンド トゥルース注釈付きデータを含む包括的なデータセットを提供するとともに、アモーダル深度推定と呼ばれる空間理解を強化するための新しいタスクも導入します。この論文では、60,000 を超える個別の画像セットが提供されており、それぞれがアモーダルインスタンスセグメンテーション、アモーダルセマンティックセグメンテーション、アモーダルパノプティックセグメンテーション、オプティカルフロー、2D および 3D 境界ボックス、アモーダル深度、鳥瞰図に関連付けられています。 AmodalSynthDrive を通じて、私たちはある種のベースラインを提供しており、この研究が動的な都市環境におけるアモーダルシーン理解の新たな研究への道を開くと信じています。

オリジナルリンク: https://mp.weixin.qq.com/s/7cXqFbMoljcs6dQOLU3SAQ

<<:  人工知能技術は建設業界をどのように変えるのでしょうか?

>>:  これは魔法ですか? ICCV 2023 の優秀な学生論文など、すべての情報を一度に追跡しましょう。 Githubには1.6Kのスターがあります

ブログ    
ブログ    
ブログ    

推薦する

百度研究所が新しいAIツールを発表:10分以内に記事を自動的に動画に変換可能

[[322859]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

AIが医療診断を改善する方法

人工知能システムは刻々と賢くなっています。運転や自然言語の理解などの複雑なタスクはすでに AI で実...

...

AI、ブロックチェーン、ビッグデータなど最先端の技術動向を明らかにする新刊書籍「風向」が発売

2018年12月8日、中国国家管弦楽団コンサートホールで、中国工業情報化出版メディアグループが主催し...

機械学習の参入障壁が下がり、機械学習エンジニアのポジションがなくなる可能性も

機械学習エンジニアチームの責任者であり、Looker の最高製品責任者でもある彼は、10 年を超える...

AIが小売業の顧客体験に革命を起こす

人工知能はすでに多くの業界に大きな影響を与えています。調査会社IDCの調査によると、2019年の人工...

2020年に人工知能は私たちの生活をどのように変えたのでしょうか?

2020年はごく平凡な年であると同時に、非常に非凡な年でもありました。生活の面では、人工知能が配達...

誰かが匿名ソフトウェアで私の学校を爆破したいと言っていたので、私はすぐに先生と警察に通報しました。xdm、私は正しいことをしたのでしょうか?

ビッグデータダイジェスト制作著者: カレブ空には太陽が輝き、花々は私に微笑みかけ、鳥たちは「おはよう...

世界最大の多言語音声データセットがオープンソースになりました! 23言語で40万時間以上

[[416170]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

北京、自動運転路上試験の新規則を発表、有人試験も可能に

最近、北京市交通委員会は新たに改訂された「北京市自動運転車両路上試験管理実施規則(試行)」を発行し、...

...

2022年のAI時代、将来のトレンドに関する洞察

Appleの携帯電話に搭載されているインテリジェントなパーソナル音声アシスタントSiriから、Alp...

Baidu Brain の「EasyDL Classic Edition」はあなたを魅了しました。実際の業界アプリケーションを手に入れましたか?

既存のビジネスやソリューションをベースに、企業は AI 機能を導入することで、どのようにすれば効率性...

面接で使えるEslintのFix機能に隠されたアルゴリズムの質問

[[422353]] eslint が修正をサポートしていることはわかっています。--fix パラメ...