Baidu は、「同様のデータセットの 10 倍」のデータ量を持つ自動運転データセットをリリースしました。注目すべき点は何ですか?

Baidu は、「同様のデータセットの 10 倍」のデータ量を持つ自動運転データセットをリリースしました。注目すべき点は何ですか?

[[222004]]

常にオープンで、常に新しいメンバーを引き付けてきた百度のアポロ自動運転プラットフォームは、最近「常識を打ち破り」、カリフォルニア大学バークレー校のディープドライブ自動運転業界連合に加盟したことを率先して発表した。

米国時間3月8日、百度はアポロ自動運転オープンプラットフォームがDeepDriveディープラーニング自動運転業界アライアンスに正式に加盟し、アポロ自動運転データセット「ApolloScape」をリリースしたと発表した。

百度アポロプラットフォームがこの業界連合に積極的に参加するきっかけとなったのは、おそらく後者の自動運転における豊富な学術的成果と産業資源だろう。

UC Berkeley (カリフォルニア大学バークレー校) について十分にご存知であれば、DeepDrive が UC Berkeley の自動車インテリジェンス関連の 2 つの主要な研究所の 1 つ (もう 1 つは InterACT) であることをご存知でしょう。

DeepDrive の研究成果は研究室にとどまらず、業界と密接に連携しています。現在のパートナーには、Bosch や ZF などの一流サプライヤー、フォルクスワーゲン、ホンダ、ヒュンダイなどの自動車メーカー、NXP や NVIDIA などのチップメーカー、Huawei や UISEE などの中国企業が含まれています。

*ディープドライブ研究プロジェクトのパートナー

DeepDrive ディープラーニング自動運転業界連合は、カリフォルニア大学バークレー校が主導する業界連合であり、自動車分野で使用するための最先端のコンピューター ビジョンと機械学習技術を研究しています。

メンバーには、NVIDIA、Qualcomm、GM、Ford など、自動運転の分野で世界をリードする 20 社が含まれています。研究プロジェクトは、認識、計画と意思決定、ディープラーニングなど、自動運転の主要分野をカバーしています。

Baiduがこの提携に参加する目的は、世界有数の自動運転企業やトップクラスの学術研究機関と連携し、研究成果を共有し、自動運転の技術革新と応用プロセスを加速することで、自動運転の研究開発能力を強化することです。

ApolloScape: データ量は類似データセットの10倍以上

このリリースのもう一つのハイライトは、Baidu によって公開された ApolloScape データセットです。

データセットは一般的に 2 つのカテゴリに分けられます。1 つは一般データセットで、純粋なコンピューター ビジョン分野で提案されたデータセットです。このタイプのデータセットには「車」の要素のみが含まれます。もう 1 つは自動運転データセットで、コンピューター ビジョン情報だけでなく、IMU、GPS などの情報も含まれています。たとえば、KITTI は自動運転シナリオ向けの世界最大のコンピューター ビジョン アルゴリズム評価データセットであり、その地位を過小評価することはできません。

明らかに、Baidu も ApolloScape をそのようなデータセットに組み込むことを望んでいます。では、ApolloScape データセットのハイライトは何でしょうか?

Baidu は、大量かつ高品質の実データこそが自動運転の開発とテストに欠かせない「原材料」であると考えています。そのため、ApolloScape のデータ量は、同様のデータセット (Cityscapes など) の 10 倍以上となっています。

データ量には、知覚、シミュレーション シーン、道路ネットワーク データ、ピクセル単位のセマンティック セグメンテーションと注釈が付いた高解像度画像データの数十万フレームが含まれます。 Baiduは、データの難易度の観点から、ApolloScapeデータセットはより複雑な道路状況をカバーしていると述べた。たとえば、1 枚の画像に最大 162 台の車両または 80 人の歩行者が写ります。

さらに、このオープン データセットでは、ピクセル単位のセマンティック セグメンテーションと注釈が使用されています。Baidu は、これが「現在入手可能な最も複雑で、最も正確に注釈が付けられ、最大の自動運転データセット」であると主張しています。

ApolloScape 注釈付きデータの例

[[222006]]

ApolloScape 深度データの例

データインスタンスにおける Kitti、CityScapes、ApolloScape の比較

ApolloScape のもう 1 つの特徴は、ピクセル単位のセマンティック セグメンテーション注釈が付いた高解像度画像データのフレームが数十万個含まれていることです。

研究者がデータセットの価値をより有効に活用できるように、Baidu はデータセット内のさまざまなセマンティック項目 (車、自転車、歩行者、建物、街灯など) の合計 26 のデータ インスタンスを定義し、さらに複雑な環境、天候、交通状況をカバーします。

データに含まれる各インスタンスの種類に関する情報

シミュレーションもこのデータセットの重要なプロジェクトです。 Baidu の目標は、現実世界の最高レベルの再現と最も豊富なシナリオを備えたシミュレーション プラットフォームを作成することです。

Leifeng.comによると、ApolloScapeはApolloシミュレーションプラットフォームを基盤として、数十台の自動運転車両を同じ道路網に投入する計画だ。実際の複雑な運転シナリオや複数車両のゲームプロセスをシミュレーションすることで、研究開発担当者が予測、意思決定、経路計画などのアルゴリズムを効果的にテストして最適化し、自動運転テストの多様性を向上させるのに役立つ。

このデータセットを活性化し、より多くの開発者がApolloScapeデータセットを使用するように促すため、今年のCVPR期間中、Baidu Apolloはカリフォルニア大学バークレー校と共同で自動運転に関するワークショップを開催し、世界中の自動運転の開発者や研究者に技術革新とアプリケーション革新のプラットフォームを提供することを目指しています。

「大きなシステム」と「小さなモジュール」

これまで、コンピューター ビジョンが直面していた一般的な問題は、古いアルゴリズムが新しいデータセットでは機能しないことでした。

「我々は問題を解決したと主張しているが、解決したのはデータセットだけだ。これは本当に問題を解決したということではなく、このようなことはいつも起きている」と、国内の自動運転企業のCTOはLeiphone.com(公式アカウント:Leiphone.com)に語った。

たとえば、自動運転の「大きなシステム」を 100 個の小さなコンピューター ビジョンの問題に分解できます。

しかし、考えてみる価値のある点が 2 つあります。1 つ目は、これら 100 の問題のうちどれがより重要なのかがわからないことです。2 つ目は、自動運転の問題を完全に解決したと主張できるようになるまでに、どの問題をどの程度解決する必要があるのか​​がわからないことです。

したがって、自動運転の「大きなシステム」と「小さなモジュール」の間の問題をどのように解決するかは、Baidu ApolloScapeデータセットが確立する必要がある次の利点であり、実践者と開発者が必要とする自動運転データセットでもあります。

<<:  マイクロソフト:オープンソースソフトウェアとクラウドコンピューティングは人工知能と機械学習を推進する主な手段

>>:  Baidu のディープラーニング プラットフォーム PaddlePaddle フレームワークの分析

ブログ    

推薦する

TensorFlow を使用した ML モデルの実装と最適化: 1 秒あたり 3 億回の予測

[[425184]] TensorFlow は最も広く使用されている機械学習フレームワークの 1 つ...

GPT-4 MATHの精度は84.3%まで上昇しました!香港中文大学や清華大学を含むトップ7大学が新たなCSV方式を提案

大規模言語モデル (LLM) は常識理解やコード生成などのタスクでは大きな進歩を遂げていますが、数学...

MIT、「上級数学」ソルバーの強化版をリリース:7つのコースの正解率は81%

AIは小学校の算数の文章題を解くだけでなく、高度な数学にも取り組み始めています。最近、MIT の研...

人工知能は歯科医療の分野におけるブルーオーシャンである

過去 20 年間で、世界はテクノロジーにおいて驚異的な進歩を遂げ、人間の生活のさまざまな側面に影響を...

Google Brain の公開: アルゴリズムのエラー修正と AI バイアスの解決に重点を置く

テンセントテクノロジーニュース、1月29日、海外メディアの報道によると、グーグルCEOサンダー・ピチ...

...

「百度脳産業イノベーションフォーラム」が本格始動、伝統産業向けAIソリューションを提案

「将来、AIとは何の関係もないと主張する企業はなくなるだろう」これは、2018年の世界人工知能会議で...

顔認識とは何ですか?あなたは顔認識技術を本当に理解していますか?

近年、人工知能の発展により、膨大なデータに基づく顔認識技術がさまざまな分野で広く利用されるようになり...

チューリング賞受賞者ジョン・ヘネシー氏:データと機械学習は世界をより良い場所にする

5月26日、チューリング賞受賞者で米国工学アカデミー会員のジョン・ヘネシー氏が、2021年中国国際ビ...

AIテスト:自動運転車のテストに関するケーススタディ

編集者注:最近、清華大学自動化学部システム工学研究所の李立准教授を筆頭著者として、林一倫、鄭南寧、王...

データ構造とアルゴリズム、グラフをトラバースする2つの方法を理解する

[[331362]] 1 はじめにトラバーサルとは、特定のノードから開始し、特定の検索ルートに従って...

...

...

2020年のAIの7つの開発トレンド

[[320187]]追加の AI アプリケーションの需要が高まるにつれて、企業はデータ サイエンス ...

専門家:歩行者の安全問題を解決するために都市は自動運転だけに頼ることはできない

自動運転技術が業界全体で開発のマイルストーンに到達し続ける一方で、都市は自動運転車(AV)の目標を補...