エンドツーエンドの自動運転に向けて、Horizo​​n Robotics が Sparse4D アルゴリズムを正式にオープンソース化

エンドツーエンドの自動運転に向けて、Horizo​​n Robotics が Sparse4D アルゴリズムを正式にオープンソース化

Horizo​​n Roboticsは1月22日、純粋な視覚ベースの自動運転アルゴリズムであるSparse4Dシリーズのアルゴリズムを一般に公開し、エンドツーエンドの自動運転やスパース知覚などの最先端技術の探求に業界の開発者が参加することを奨励しました。現在、Sparse4D アルゴリズムは GitHub プラットフォームで利用可能です。開発者は Horizo​​n の公式 GitHub アカウント「Horizo​​n Robotics」をフォローしてソースコードを入手できます。

Sparse4D は、時間的マルチビュー融合認識技術のカテゴリに属する​​、長期シリーズのスパース 3D オブジェクト検出に向けた一連のアルゴリズムです。 Sparse4D は、スパース知覚の業界発展の傾向に応えて、純粋にスパースな融合知覚フレームワークを構築し、知覚アルゴリズムをより効率的かつ正確にし、知覚システムをより簡潔にしました。 Sparse4D は、高密度 BEV アルゴリズムと比較して計算の複雑さを軽減し、認識範囲における計算能力の制限を打ち破ります。認識効果と推論速度の両方で高密度 BEV アルゴリズムを上回ります。 Sparse4D は、nuScenes ピュアビジョン 3D 検出リストと 3D トラッキング リストの両方で 1 位にランクされ、SOLOFusion、BEVFormer v2、StreamPETR などの最新の方法の数々を抑えて SOTA になりました。

Sparse4Dアルゴリズムアーキテクチャ

3 バージョンの反復を経て、Horizo​​n Sparse4D チームは、スパース アルゴリズムのパフォーマンスの向上、時系列融合計算の複雑さの軽減、エンドツーエンドのターゲット追跡の実現などの技術的な困難を克服し、最近「Sparse4D v3: エンドツーエンドの 3D 検出と追跡の進化」という論文を発表しました。 Sparse4D は、Horizo​​n のビジネス データに基づいてパフォーマンス検証を完了し、Horizo​​n Journey 5 コンピューティング ソリューションに導入されました。計画によれば、Sparse4D は Horizo​​n の次世代製品に使用される予定です。

Horizo​​n Robotics の副社長兼ソフトウェア プラットフォーム製品ラインの社長である Yu Yinan 博士は、次のように述べています。「業界は、単一のネットワークで認識タスク全体を完了できるエンドツーエンドの認識の時代に入りました。Sparse4D シリーズのアルゴリズムは、スパース アルゴリズムのパフォーマンスを新しいレベルに引き上げ、エンドツーエンドのマルチターゲット追跡を実現しました。これは、スパース認識とエンドツーエンドの自動運転の両方にとって画期的な出来事です。Horizo​​n Robotics は、Sparse4D を業界全体にオープンソース化することを決定しました。業界の優れた開発者とともに進歩していくことを楽しみにしています。」

従来の認識システムとエンドツーエンドの認識システムの比較

Sparse4D シリーズのアルゴリズムのオープンソース化は、インテリジェント ドライビングのためのオープンソース ソフトウェア エコシステムの構築に Horizo​​n が積極的に参加しているもう 1 つの例です。近い将来、Sparse4D は業界の開発者に広く使用され、純粋なビジョンによるエンドツーエンドの自動運転の実装を大きく促進すると予想されます。さらに、Horizo​​n は最近、ベクトル化されたシーン表現に基づくエンドツーエンドの自動運転アルゴリズムである VAD や、エンドツーエンドのベクトル マップのオンライン構築方法である MapTR などの先進技術をオープンソース化し、業界の加速的な発展を継続的に推進しています。

Horizo​​n Roboticsは、技術の源泉をスマートカー産業のエコシステムに浸透させることに注力しています。独自の革新的な技術、画期的な製品、ソリューションを、より多くのスマートカー産業のエコシステム パートナーの商業価値に変換し、業界のすべての関係者と緊密に連携し、オープンに統合し、イノベーションに協力することに注力しています。 Horizo​​n は、自動運転の量産化に向けて、オープンソースとオープン性を推進し続け、最先端技術をより迅速に量産化へと移行させ、業界とともに明るい未来を創造していきます。

<<: 

>>:  「幻想」を消し去れ! Google の新しい ASPIRE メソッドにより、LLM は自己採点が可能になり、その効果はボリューム モデルよりも 10 倍優れています。

ブログ    
ブログ    

推薦する

シングルポイントのエンドツーエンドのテキスト検出および認識フレームワークは 19 倍高速です。華中科技大学、華南理工大学などが共同でSPTS v2をリリース

近年、シーンテキスト読み取り(テキストスポッティング)は大きな進歩を遂げており、テキストの検索と認識...

ファーウェイが推進する「マシンビジョン」はインダストリー4.0成功の鍵となるのか?

最近、「新インフラ」や「デジタルインフラ」がホットワードとなっている。新インフラの一つである「産業イ...

AI がモノのインターネットをよりスマートにする 5 つの方法

第三者の介入なしに何十億ものデバイスを接続してデータを交換できるため、モノのインターネット (IoT...

オブジェクト ストレージが AI と機械学習に適している 3 つの理由!

[[329860]] 【51CTO.com クイック翻訳】あらゆる種類の企業が AI や機械学習プ...

スマートビルディングにおけるエッジAIの役割を解明

仕事や住居のための物理的な空間として機能することから、入居者に活気ある建築体験を提供することまで、近...

バブルソートに加えて、Python の組み込みソートアルゴリズムをご存知ですか?

プログラミング アルゴリズムに関して、多くの読者が学校で最初に学ぶのはバブル ソートかもしれませんが...

機械学習向けのテキスト注釈ツールとサービスのトップ 10: どれを選びますか?

[[347945]] [51CTO.com クイック翻訳] 現在、検索エンジンや感情分析から仮想ア...

技術革命は初期の成果を達成した:AIはサプライチェーン管理の分野で2つの地位を獲得した

データ共有は依然として課題ですが、多くの組織はすでに AI の力をサプライ チェーン管理の 2 つの...

Hinton チームの新しい CV 研究: ターゲット検出に言語モデルを使用、DETR に匹敵するパフォーマンス

[[426028]]視覚オブジェクト検出システムは、画像内のすべての定義済みカテゴリのオブジェクト...

エイリアンがトレンド検索リストのトップに!米国が初のUFO公聴会を開催

昨日、米国議会の公聴会が中国国内の複数のメディアのトレンド検索のトップに躍り出た。 これを一言でまと...

人工知能がやって来ます。準備はできていますか?

ちょうど2年前、大学に入学したときに一度だけ行ったことがあります。その時は、まず入り口の機械で番号を...

Excelが変わりました! MicrosoftはPythonを搭載しているので、機械学習を直接行うことができます。

素晴らしいニュースです! Microsoft が Excel に Python を導入しました。 E...

...