インテルラボ、テキストプロンプトに基づいて360度パノラマ画像を生成する新しいAI拡散モデルをリリース

インテルラボ、テキストプロンプトに基づいて360度パノラマ画像を生成する新しいAI拡散モデルをリリース

6月21日、Intel ResearchはBlockade Labsと提携してLDM3D(Latent Diffusion Model for 3D)モデルをリリースしたと発表しました。この新しい拡散モデルは、生成AIを使用して3Dビジュアルコンテンツを作成します。

報道によると、 LDM3D は拡散プロセスを使用して深度マップを生成し、リアルで没入感のある 360 度パノラマを生成する業界をリードするモデルです。 LDM3D は、コンテンツ作成、メタバース アプリケーション、デジタル エクスペリエンスに革命をもたらし、エンターテイメント、ゲーム、建築、デザインなど多くの業界を変革する可能性があります。

インテルは、LDM3D は 10,000 個のサンプルを含む LAION-400M データセットのサブセットでトレーニングされたと述べた。 LAION-400M は、4 億を超える画像とテキストのペアを含む大規模な画像とテキストのデータセットです。研究チームは、トレーニング コーパスに注釈を付ける際に、Intel Labs が以前に開発した高密度深度推定モデルである DPT-Large を使用しました。このモデルは、画像内の各ピクセルに対して非常に正確な相対深度を提供します。 LAION-400M データセットは、研究者やその他の関心のあるコミュニティがより大規模なモデルトレーニングをテストできるように、研究目的で作成されました。

LDM3Dモデルは、Intel XeonプロセッサとIntelを搭載したIntel AIスーパーコンピュータでトレーニングされました。 ハバナガウディAIアクセラレータドライバー。最終的なモデルとパイプラインは、RGB 画像と深度マップを統合して、没入感のある体験を実現する 360 度のパノラマを生成します。

<<:  テスラがテスラAIのTwitterアカウントを開設、Dojoスーパーコンピューターの生産を来月開始すると発表

>>:  エッジ AI がインダストリー 4.0 の成果を推進する方法

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2年後、マスクはついに「脳内挿管」というブラックテクノロジーをリリースし、脳コンピューターインターフェースを革新した。

設立から2年を経て、マスク氏の有名な脳コンピューターインターフェース研究会社Neuralinkがつい...

サイバー犯罪者が機械学習を利用する 7 つの方法: 対抗策

[51CTO.com クイック翻訳] イスラエルのベングリオン国際空港は、世界で最も安全な空港の一つ...

2022 年に予測されるロボット技術のトレンド トップ 10

COVID-19パンデミックは、物流やスーパーマーケットなどの分野に問題と機会の両方をもたらしまし...

...

「無人時代」が来ます。準備はできていますか?

DJIのドローン、JDの無人倉庫、アリババの無人スーパー、百度の無人自動車など、数年前からすでに台...

スマートビルディングにおける技術の陳腐化にどう対処するか?

今日の建物、ましてや将来のスマート ビルにとって、技術インフラの重要性はいくら強調してもし過ぎること...

クラウド ネイティブが新たな標準になりますが、人工知能はそれに備えていますか?

テクノロジーの発展に伴い、クラウド コンピューティング テクノロジーは進歩し続け、その目的も変化して...

...

推奨システムにおけるTensorFlowの分散トレーニング最適化の実践

著者 | Yifan、Jiaheng、Zhengshao などMeituan の高度にカスタマイズさ...

モノのインターネット、人工知能、ブロックチェーン、どれがあなたにぴったりでしょうか?

今はお金を稼ぐのが難しく、ビジネスも簡単ではないと言う人もいますが、今こそ最高の時代だと言う人もいま...

AI と機械学習はデータセンター運用にどのような変化をもたらすのでしょうか?

今日のデータセンターは、ほぼ克服不可能と思われる課題に直面しています。データ センターの運用はかつて...

機械学習をプログラマーにとってより身近なものにする方法

導入人々は長い間、人工的に生成されたコンテンツを理解するためにアルゴリズムを手動でコーディングしよう...

マイクロソフトは小売業界で新たなスキルを解き放つために人工知能を推進

NRF 2024: Retail’s Big Show に先立ち、マイクロソフト社は、ショッピング体...

国内チームが新たなRLTFフレームワークを提案し、SOTAをリフレッシュしました!大規模なモデルはバグが少なく、より高品質なコードを生成します

「プログラム合成」または「コード生成」タスクの目標は、与えられた記述に基づいて実行可能なコードを生成...

...