この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 「これはおかしい!」 「18か月前、NeRFのトレーニングには5時間かかりました…」 「2か月前は、NeRFのトレーニングに5分しかかかりませんでした!」 「NeRFの訓練は5秒で完了する!?」 いったい何が起こったのでしょうか?これは実際に Google の研究科学者を驚かせました。 (以前人気のあった NeRF モデルを挿入します。バークレーと Google が共同で作成したもので、いくつかの静止画像から 3D のリアルな効果が生成されます) 同じようなレビューが沢山ありますよ〜 この技術を紹介するブログ記事も非常に人気があり、1日も経たないうちに数千件の「いいね!」を獲得しました。 これは NVIDIA の最新技術、つまりマルチ解像度ハッシュコーディングに基づくリアルタイム ニューラル グラフィックス プリミティブであることがわかりました。 キツネの NeRF モデルのトレーニングにはわずか 5 秒しかかかりません。 さらに、このテクノロジーは NeRF をトレーニングするだけでなく、他のタスクでも驚異的なトレーニング速度を実現します。
単一 GPU でのリアルタイム マルチタスク トレーニングまずは結果を見てみましょう。 ラボで目が回りそう?5分間のiPhoneビデオトレーニングで360度リアルタイムレンダリング効果を体験~ 実物写真34枚を使って3D画像を再現したいですね〜 NeRF に加えて、ニューラル グラフィックス プリミティブの実装が 3 つあります。 ギガピクセル画像 著者はまた、ネットワークは最初からトレーニングされており、瞬きすると見逃してしまう可能性があることを親切に思い出させてくれます。 各ケースは tiny-cuda-nn フレームワークを使用してトレーニングおよびレンダリングされ、この実験は RTX 3090 でテストされました。完全に接続されたネットワークによってパラメータ化されたニューラル グラフ プリミティブのトレーニングと評価にはコストがかかります。 この論文では、コストを削減するために、汎用性の高い新しい入力エンコーディングを使用しています。 このエンコーディングにより、品質を犠牲にすることなく小規模なネットワークを使用できるようになり、浮動小数点数とメモリアクセスの数が大幅に削減されます。 具体的には、小さなニューラル ネットワークに、トレーニング可能な特徴ベクトルのマルチ解像度ハッシュ テーブルが追加されます。これらの特徴ベクトルの値は、確率的勾配降下法によって最適化されます。 つまり、このエンコーディングはタスクに依存しません。 研究チームは、ハッシュテーブルのサイズのみを変更し、すべてのタスクで同じ例とハイパーパラメータを使用したと述べています。 このプロジェクトは現在オープンソースになっており、興味のある方は以下のリンクをクリックしてください。 GitHub リンク: |
<<: 中国科学院は「触覚」を備えたロボットを開発し、豚の肝臓に低侵襲手術を成功させた。
>>: 改良された ResNet が Transformer を上回り、アーキテクチャの戦いが再燃します。著者は「革新はない」と述べた
[[275753]] [51CTO.com クイック翻訳] あらゆる業界の先進的な企業は、人工知能を...
自動化システムでは、ディープラーニングとコンピュータービジョンが広く普及し、あらゆる場所で利用されて...
共同通信によると、国土交通省は月面に滞在できる基地を建設するため、無人重機の開発を進めている。日本は...
現在、建設部門は大規模なプロジェクトによって活性化しており、大きな成長を牽引しています。しかし、これ...
今年は国内のテクノロジーメーカーが各分野で続々と大型モデルを発売し、「モデル戦争」が本格化しているが...
コンピュータサイエンスとエレクトロニクスの急速な発展により、顔認証は現在、指紋に次いで世界第2位の市...
[51CTO.comからのオリジナル記事]新たな技術革命の到来により、技術革新は世界の発展の核心的...
ビッグデータと機械学習を組み合わせることで、ビジネスの競争優位性を獲得するために必要な、すでに保有し...
出典 | https://www.infoworld.com/article/3707989/why...
言うまでもなく、ChatGPT が過去 6 か月間でどれほど人気があったかは誰もが知っています。...
C# アルゴリズムは張さんの誕生日問題をどのように実装するのでしょうか?まず、張さんの誕生日に関する...