たった5秒でNeRFをトレーニング? ! Nvidia の新技術は Google の研究者の手に負えない | オープンソース

たった5秒でNeRFをトレーニング? ! Nvidia の新技術は Google の研究者の手に負えない | オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

「これはおかしい!」

「18か月前、NeRFのトレーニングには5時間かかりました…」

「2か月前は、NeRFのトレーニングに5分しかかかりませんでした!」

「NeRFの訓練は5秒で完了する!?」

いったい何が起こったのでしょうか?これは実際に Google の研究科学者を驚かせました。

(以前人気のあった NeRF モデルを挿入します。バークレーと Google が共同で作成したもので、いくつかの静止画像から 3D のリアルな効果が生成されます)

同じようなレビューが沢山ありますよ〜

この技術を紹介するブログ記事も非常に人気があり、1日も経たないうちに数千件の「いいね!」を獲得しました。

これは NVIDIA の最新技術、つまりマルチ解像度ハッシュコーディングに基づくリアルタイム ニューラル グラフィックス プリミティブであることがわかりました。

キツネの NeRF モデルのトレーニングにはわずか 5 秒しかかかりません。

さらに、このテクノロジーは NeRF をトレーニングするだけでなく、他のタスクでも驚異的なトレーニング速度を実現します。

数桁の組み合わせ高速化が達成されました。

高品質のニューラル グラフィックス プリミティブを数秒でトレーニングし、数十ミリ秒で 1920 x 1080 の解像度のグラフィックスをレンダリングできます。

単一 GPU でのリアルタイム マルチタスク トレーニング

まずは結果を見てみましょう。

ラボで目が回りそう?5分間のiPhoneビデオトレーニングで360度リアルタイムレンダリング効果を体験~

実物写真34枚を使って3D画像を再現したいですね〜

NeRF に加えて、ニューラル グラフィックス プリミティブの実装が 3 つあります。

ギガピクセル画像

著者はまた、ネットワークは最初からトレーニングされており、瞬きすると見逃してしまう可能性があることを親切に思い出させてくれます。

各ケースは tiny-cuda-nn フレームワークを使用してトレーニングおよびレンダリングされ、この実験は RTX 3090 でテストされました。

完全に接続されたネットワークによってパラメータ化されたニューラル グラフ プリミティブのトレーニングと評価にはコストがかかります。

この論文では、コストを削減するために、汎用性の高い新しい入力エンコーディングを使用しています。

このエンコーディングにより、品質を犠牲にすることなく小規模なネットワークを使用できるようになり、浮動小数点数とメモリアクセスの数が大幅に削減されます。

具体的には、小さなニューラル ネットワークに、トレーニング可能な特徴ベクトルのマルチ解像度ハッシュ テーブルが追加されます。これらの特徴ベクトルの値は、確率的勾配降下法によって最適化されます。

つまり、このエンコーディングはタスクに依存しません。

研究チームは、ハッシュテーブルのサイズのみを変更し、すべてのタスクで同じ例とハイパーパラメータを使用したと述べています。

このプロジェクトは現在オープンソースになっており、興味のある方は以下のリンクをクリックしてください。

GitHub リンク:
https://github.com/NVlabs/instant-ngp
論文リンク:
https://nvlabs.github.io/instant-ngp/assets/mueller2022instant.pdf
プロジェクトリンク:
https://nvlabs.github.io/instant-ngp/

<<:  中国科学院は「触覚」を備えたロボットを開発し、豚の肝臓に低侵襲手術を成功させた。

>>:  改良された ResNet が Transformer を上回り、アーキテクチャの戦いが再燃します。著者は「革新はない」と述べた

ブログ    
ブログ    

推薦する

AIビッグモデルデータ注釈「出稼ぎ労働者」の月収は5000元以下、単価は50セントから4セントに下落

10月9日のニュースによると、AIビッグモデルは近年、人工知能の分野で話題になっており、リアルなテ...

...

2024 年のビッグデータ業界予測 (パート 2)

ビッグデータデジタル変革への投資は、特にインフレが継続する中で、リスク管理の強化、コストの削減、顧客...

Meili United が VALSE カンファレンスで「ファッションをグラフィックで説明」する画像アルゴリズムの体験を共有する方法

最近、第7回ビジョンと学習セミナー(VALSE)が厦門大学で成功裏に終了しました。 VALSE は ...

ChatGPT 以外にも驚くような 6 つの AI ツール

今日の急速に変化する世界では、私たちが日常生活で処理しなければならないデータとタスクの量は膨大です。...

2022 年の優れたインテリジェント オートメーションのトレンドと予測

調査によると、2022年までにインテリジェントオートメーションのトレンドが拡大し、デジタル変革が急速...

人工知能は人類に潜在的に壊滅的なリスクをもたらす

11月1日、米国、英国、中国を含む28か国がブレッチリーで開催された第1回世界人工知能(AI)セキュ...

...

ナレッジグラフを使用して RAG 機能を改善し、大規模モデルの幻覚を軽減する

幻覚は、大規模言語モデル (LLM) を使用するときによく発生する問題です。 LLM は流暢で一貫性...

自動化を推進するAIテストツール

テスト自動化における人工知能の使用は、品質保証業界を支配する最新のトレンドの 1 つです。実際、キャ...

...

筋肉の震えもはっきりと見えます! 3D人体モデル自動生成アルゴリズム、第一著者北京大学チューリングクラス

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

OpenAIの「コピー&ペースト」の背後にあるのは、盗作者が全てを無料で手に入れたいということ

今日では、盗作された記事や作品が出版され、盗作者がそれを無料で使用したり、利益を得たりすることは珍し...

2018年の人工知能の発展に関する5つの予測

2017年は人工知能技術(AI)において画期的な発展があった年でした。過去 1 年間の大きな宣伝にも...

インターネットの未来のために: AI が生み出すものと破壊するもの

編集者注: この記事はNetEase Intelligenceからのものです。翻訳|: NetEas...