2Dを3Dにするには、たった2枚の写真だけが必要です。このAIは、ろうそくを吹き消すプロセスを想像することができます。第一著者と第二著者はともに中国人です。

2Dを3Dにするには、たった2枚の写真だけが必要です。このAIは、ろうそくを吹き消すプロセスを想像することができます。第一著者と第二著者はともに中国人です。

廃棄フィルム2枚がパチンと貼り合わされました!

見逃した素晴らしい瞬間をすぐに蘇らせることができ、効果も2Dから3Dにアップグレードできます。

見てください、小さな男の子のかわいい笑顔がすぐに現れます。

誕生日ケーキのろうそくを吹き消す瞬間も再現されました。

笑う過程はすごく癒される〜

私たちが言いたいのは、今度はカメラに残されたいたずらっ子や毛むくじゃらの子供たちの無駄な写真が、ようやく救われるということです!

そして、それがポストプロダクション合成の結果であることがわかる方法はなく、まるでオリジナルで撮影されたかのようです。

これは、Google、コーネル大学、ワシントン大学の最近の共同成果です。類似した写真 2 枚のみを使用して 3D の瞬間を復元することができ、CVPR 2022 に含まれています。

この論文の第一著者と第二著者はともに中国人で、第一著者は浙江大学を卒業している。

2枚の写真を使って、中間のシーンを前後に予測します。

この方法は、連続撮影によって作成された一連の写真など、2 枚の写真が非常に似ている場合に適しています。

この方法の鍵となるのは、2 枚の画像を特徴ベースの階層化深度画像 (LDI) のペアに変換し、シーン フローによって強化することです。

全体のプロセスでは、2 枚の写真をそれぞれ「開始点」と「終了点」と見なし、2 枚の写真の間のあらゆる瞬間の変化を徐々に予測することができます。

具体的には、次のプロセスになります。

まず、ホモグラフィ行列を使用して 2 枚の写真の位置合わせを行い、2 枚の写真の密な深度マップをそれぞれ予測します。

次に、各 RGBD イメージはカラー LDI に変換され、背景の遮蔽された部分は奥行き知覚によって修復されます。

このうち、RGB 画像は、通常の RGB 画像 + 深度画像です。

次に、2次元特徴抽出器を使用してLDIの各カラーレイヤーを修復し、特徴レイヤーを取得し、2つの特徴レイヤーを生成します。

次のステップは、シーンの動きをシミュレートすることです。

2 つの入力画像間の深度と光学フローを予測することで、LDI 内の各ピクセルのシーン フローを計算できます。

2 つの画像の間に新しいビューをレンダリングして 3D にアップグレードする場合は、特徴値を持つ 2 セットの LDI を 3D ポイント クラウドのペアにアップグレードし、シーン フローに沿って中間の時点まで双方向に移動する必要があります。

次に、3 次元の特徴点が投影および拡張され、前方および後方の 2 次元の特徴マップと対応する深度マップが形成されます。

最後に、これらのマッピングはタイムライン内の対応する時点の重みと線形に混合され、その結果が画像合成ネットワークに渡されて最終的な効果が得られます。

実験結果

データの観点から見ると、この方法はすべてのエラー指標においてベースライン レベルよりも高くなっています。

UCSDデータセットでは、この方法により、(d)に示すように、画像の詳細をより多く保存できます。

NVIDIA データセットでのアブレーション実験では、この方法がレンダリング品質の向上に効果的であることが示されています。

ただし、いくつか問題があります。2 つの画像間の変化が大きい場合、オブジェクトが間違った場所に配置されます。

例えば、下の写真では、ワインボトルの口が動いてしまい、変化しないはずのワイングラスも揺れ始めました。

また、写真に全域が写っていないと、下の写真のコアラに餌をあげている手のように、合成時にどうしても「切断」が生じてしまいます。

論文の宛先:

https://3d-moments.github.io/

<<:  製造業におけるコンピューター ビジョン: 機会と導入のヒント

>>:  物理学と機械学習が出会うとき: 物理学の知識に基づく機械学習のレビュー

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

新しいアルゴリズムによりクラウドデータベースのパフォーマンスが向上

Gigaom の Jordan Novet 氏の報告によると、MIT の研究者らは DBSeer と...

...

「未来ロボット」が1億元の資金調達を完了。自動物流が次の「阿修羅場」となるか?

2021年上半期、世界経済が回復し始めると、自動車業界も着実に回復し始め、自動車メーカーは電動化と...

AI は旅行体験をどのように向上させることができるのでしょうか?

AI を活用した休暇は旅行の未来であり、かつては考えられなかったパーソナライズされた没入型の体験を...

大規模言語モデルを導入し、国内初のコンピューティングパワーエコシステムをサポートする新しいオープンソースRLフレームワークRLLTEが登場

近年、強化学習に対する研究熱は高まり続けており、インテリジェント製造、自動運転、大規模言語モデルなど...

人工知能の時代、栄智連は新しいメディアが新しいエコシステムを構築するのを支援します

[51CTO.com からのオリジナル記事] 今日、メディア業界はデジタル技術の影響を受けて新たな旅...

...

...

...

AIの終末: 人間は本当の自己認識を持っていない

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

MIT、失われた古代言語を解読するための新しい機械翻訳アルゴリズムを発表

MITのコンピュータ科学および人工知能研究所(CSAIL)の研究者らは、歴史から長い間失われていた古...

...

...

よく使われるソートアルゴリズムの比較と分析

1. よく使われるソートアルゴリズムの簡単な説明以下では、主にソートアルゴリズムの基本的な概念と原則...