HDビデオは本物ではなく、数枚の写真でレンダリングされた3Dシーンでは本物かどうか判断が難しい。

HDビデオは本物ではなく、数枚の写真でレンダリングされた3Dシーンでは本物かどうか判断が難しい。

今日の紹介を始める前に、次のシナリオを見てみましょう。

上記のアニメーションは、複数の写真からレンダリングされた完全な 3D シーンであることにご注意ください。人間が自分の欠点を見つけるのは難しい。

このシナリオがどのように実現されるかを見てみましょう。

メッシュとポイントは明示的であり、高速な GPU/CUDA ベースのラスタライズに適しているため、3D シーンの最も一般的な表現です。対照的に、最近のニューラル放射輝度場 (NeRF) 法は連続的なシーン表現に基づいており、通常はボリューム レイ シェーディングを使用して多層パーセプトロン (MLP) を最適化し、キャプチャされたシーンの新しいビューを合成します。これらの方法の順次的な性質は最適化に役立ちますが、レンダリングに必要なランダム サンプリングはコストがかかり、ノイズが発生します。

フランスのコート・ダジュール大学の研究者らは、両方のアプローチの利点を組み合わせた新しいアプローチを導入しました。3D ガウス表現は SOAT の視覚品質を備え、トレーニング時間に最適化されており、タイルベースのスプラッティングは、いくつかのデータセットで 1080p 解像度の SOTA リアルタイム レンダリングを実現します。

論文アドレス: https://huggingface.co/papers/2308.04079

研究チームは、複数の写真から撮影したシーンをリアルタイムでレンダリングし、典型的な現実世界のシーンで時間の最適化を実現するという目標を設定しました。これまで、Fridovich-Kei らが提案した手法では高速なトレーニングは達成できたものの、最大 48 時間のトレーニング時間を必要とする現在の SOTA NeRF 手法で得られる視覚品質を達成することは困難でした。他の研究では、シーンに基づいてインタラクティブなレンダリング(10〜15フレーム/秒)を実現できる、高速だが品質の低い放射場方式が提案されていますが、この方法では高解像度でのリアルタイムレンダリングを実現できません。

次に、この記事がどのように実装されているかを見てみましょう。

方法

研究チームの解決策は主に3つの部分から構成されています。

まず、柔軟で表現力豊かなシーン表現として 3D ガウス分布を紹介します。入力は NeRF 方式に似ています。つまり、カメラは Structure-from-Motion (SfM) を使用してキャリブレーションされ、3D ガウス セットは SfM プロセスから取得されたスパース ポイント クラウドを使用して初期化されます。さらに、本研究では、SfM ポイントのみを入力として使用して高品質の結果を得ることができました。 NeRF 合成データセットの場合、ランダム初期化でも当社の方法で高品質の結果を達成できることは注目に値します。研究によれば、3D ガウスが適切な選択であることがわかっています。

次に、3D ガウス特性、つまり 3D 位置、不透明度 𝛼、異方性共分散、球面調和関数 (SH) 係数が最適化されます。最適化プロセスにより、シーンのかなりコンパクトで構造化されていない正確な表現が生成されます。

3 番目に、リアルタイム レンダリング ソリューションとして、この研究では高速 GPU ソート アルゴリズムを使用します。ただし、3D ガウス表現のおかげで、順序付けと 𝛼 ブレンディングにより、可視性の順序付けを尊重しながら異方性ステッチングを実行できます。また、必要な数の順序付けされたステッチングのトラバースを追跡することで、高速で正確な逆方向パスが実現されます。

方法の概要

要約すると、この論文は次のような貢献をします。


  • 放射場の高品質で非構造化表現として異方性 3D ガウス分布を導入します。
  • 3D ガウス特性の最適化手法と適応密度制御を組み合わせることで、撮影したシーンの高品質な表現を実現します。
  • 可視性を考慮した GPU 用の高速微分可能レンダリング手法で、異方性ステッチングと高速バックプロパゲーションにより新しいビューを高品質に合成できます。

実験

下の図は、私たちの方法と以前の方法の比較を示しています。

上から下のシーンは、Mip-NeRF360 データセットの自転車、庭、カウンター、部屋、およびディープ ハイブリッド データセットのゲーム ルームです (詳細な比較については、元のテキストをお読みください)。自転車のスポーク、庭の向こう側にある家のガラス、鉄のバスケットの棒、おもちゃのクマなど、異なる手法によって生み出された重要な違いが図に示されています。

この論文の方法は、以前の方法よりも詳細に多くの利点があることがわかります。

動画では違いがより明らかです

さらに、図 6 では、7K 回の反復 (約 5 分) でも、私たちの方法では列車の詳細を非常によく捉えられることがわかります。 30K 回の反復 (約 35 分) では、バックグラウンド アーティファクトが大幅に減少します。庭のシーンでは、違いはほとんど目立たず、7K 回の反復 (約 8 分) ですでに非常に高品質です。

研究チームは、Mip-NeRF360 が提案した方法を採用し、データセットをトレーニング/テスト部分に分割し、8 枚の写真ごとに一貫性のある意味のある比較を行ってエラー メトリックを生成し、文献で最も一般的に使用されている標準の PSNR、L-PIPS、および SSIM メトリックを使用しました。詳細データは表 1 に示されています。

表 1 は、3 つのデータセットで計算された以前の研究と比較した新しい方法の定量的評価を示しています。 「†」マークの付いた結果は原論文から直接採用したもので、その他の結果は実験チームの実験結果です。

合成 NeRF の PSNR スコア。この論文の方法はほとんどの場合に良いスコアを示し、最高スコアに達していることがわかります。

アブレーション実験

研究チームは、さまざまな貢献とアルゴリズムの選択を分離し、それらの効果を測定するための一連の実験を構築しました。アルゴリズムのいくつかの側面がテストされました: SfM からの初期化、緻密化戦略、異方性共分散、無制限の数のパッチに勾配を持たせること、球面調和関数の使用。次の表は、各選択肢の定量的な効果をまとめたものです。

より直感的な効果を見てみましょう。

初期化に SfM ポイントを使用すると、より良い結果が得られます。

クローンと分割のためのアブレーション高密度化戦略

グラデーションを受けるポイントの数を制限すると、視覚的な品質に大きな影響を与える可能性があります。左: 受信勾配を制限する 10 個のガウス点。右: この論文の完全な方法論。

詳細は原文記事をお読みください。

<<:  致命的な幻覚問題、GPU 代替品の開発、大規模モデルが直面するその他の 10 の課題

>>:  裕福なアメリカ人の 41% は、意識をアップロードすることで不老不死を実現したいと考えています。劉慈欣の「人類の存続」は私たちの未来となるのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Baidu UNITが小能科技を支援し、ハイアールグループと提携してインテリジェントクラウド顧客サービスをアップグレード

インテリジェントな顧客サービスの分野は、2018 年に急速な発展を遂げました。企業の人件費を抑制する...

AIとロボット工学でオフショア業務を効率化する方法

長い間、肉体的に過酷で危険な仕事が特徴とされてきた石油産業は、変革を遂げつつある。この変化は、通信技...

放射線科学における LLM の潜在的な応用は何ですか?数十の研究機関が共同で31の大型モデルをテスト

近年、大規模言語モデル (LLM) は自然言語処理 (NLP) の分野で革新の波を起こしています。大...

新しい研究:ハトは人工知能と同様の方法で問題を解決する

オハイオ州立大学とアイオワ大学の研究者による研究で、ハトは問題を解決する際に人工知能に似た「力ずく」...

...

インドのチームが人間のように考えることができる自動運転アルゴリズムを開発

[51CTO.com クイック翻訳]インド工科大学 (IIT マドラス) の研究者らは、人間のように...

優れたオープンソース RPA フレームワーク 5 つ

ここ2年間、RPA+AI(インテリジェント自動化プロセス)が頻繁に言及されています。企業/機関のデジ...

AIはどれほど強力でしょうか?人間とロボットが「真・偽の孫悟空」を演じる

過去数十年にわたり、チャットボットは進化を続け、私たちの日常生活に欠かせないヘルパーになりました。携...

...

教育における人工知能の重要性とは何でしょうか?

未来は人工知能のものであるというのは議論の余地のない事実です。10年前に自動運転車や無人自動販売機に...

世界人工知能会議が開幕。ジャック・マー、ロビン・リー、イーロン・マスクらは何を語ったのか?

昨日、第3回世界人工知能大会が予定通り開催され、ジャック・マー氏、ロビン・リー氏、任宇新氏など国内の...

江長建、世界初のサイボーグと対談 - JD Smart Community 2.0 全国ローンチカンファレンス ライブプレビュー

[[374688]] 「半オーク」「半魚」… SF映画、漫画、おとぎ話では、それは驚くことではありま...

面接でコンシステントハッシュアルゴリズムについて再度質問されました。この答えは面接官を即死させるでしょう!

[[284994]]データシャーディングまずは例を見てみましょう。多くの場合、キャッシュには Re...

農家は収穫を祝い、秋分の日にドローンがその技を披露するのを見てください!

黄金の秋、収穫の季節です。また秋分の日を迎え、わが国では4回目の「農民収穫祭」を迎えます。畑や広場、...

なぜ人工知能は過大評価されているのでしょうか?

他の新しいテクノロジーと同様に、AI もハイプ サイクルと呼ばれる段階を経ます。それらはテクノロジー...