この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 ビデオから 3D 顔モデルを再構築することは珍しいことではありません。 しかし、テスターの静止画像しかない場合はどうなるでしょうか? 中国科学院パターン認識研究所の博士課程学生である郭建柱氏と彼のチームは、新しい3D 高密度顔アライメント法を提案しました。 新しい3DDFA方式の最も重要な核心は、平面内外の顔の動きをシミュレートし、静止画像を短い動画に変換できる3D 支援の短編動画合成方式です。 これでモデルの識別とトレーニングが完了します。 Guo 氏の論文「Towards Fast, Accurate and Stable 3D Dense Face Alignmen」が ECCV 2020 に掲載されました。 3DDFA-V2: 静的 1 つ、動的 1 つこれは実際には作者がリリースした 3DDFA の 2 番目のバージョンです。2 年前、チームは 3DDFA の最初のバージョンを公開しました。 新しいバージョンではパフォーマンスと安定性が向上しています。さらに、3DDFA_V2 には、元の Dlib に代わる高速顔検出器 FaceBoxes が統合されており、C++ と Cython で記述されたシンプルな 3D レンダリングも含まれています。 3DDFA はウサギと同じくらい高速です (顔の特徴の認識と位置合わせ): ダイナミックな 3D 顔モデリングもあります。 3DDFA のもう一つの側面、「処女のように静か」(静止写真からの 3D 顔再構築): 3DDFA は、静的データと動的データに加えて、写真に基づいて人物の姿勢を簡単に推定することもできます。 深度画像推定を実行します。 画像の PNCC および PAF の特徴を抽出することもできます。 3DDFA-V2 は非常に強力な顔の 3D 再構築ツールとみなすことができ、他の多くの機能も統合されています。 では、3DDFA-V2 は、写真を短い動画に変換するという最も重要な機能をどのように実現するのでしょうか? 3D支援による短編ビデオ合成3D 高密度顔位置合わせ方式をビデオ上で実行する必要があります。これにより、隣接するフレーム間で安定した 3D 再構築結果が得られます。 安定性とは、ビデオの隣接フレームにおける再構成された 3D 画像の変化が、実際のオブジェクトの細かい動きと一致していることを意味します。 しかし、既存の方法のほとんどはこの要件を満たすことができず、ランダムジッタの影響を回避することは困難です。 2D 顔登録では、時空間フィルタリングなどの後処理がジッターを減らすための一般的な戦略ですが、精度が低下し、フレーム遅延が発生します。 さらに、3D 高密度顔登録用の公開ビデオ データベースがないため、事前トレーニングにビデオを使用する方法は実現可能ではありません。 静止画像を動画に変換する際の安定性を向上させる他の方法はあるのでしょうか? 3DDFA-V2 は、バッチレベルの 3D 支援短編ビデオ合成戦略を採用しています。 静止画像を複数の隣接フレームに拡張して、合成された短いビデオのミニバッチを形成します。 一般的に言えば、ビデオの基本的なモードは次のように分けられます。
ここで、Δs はスケール摂動、Δθ は回転摂動、Δt1 と Δt2 は並進摂動です。 人間の顔は類似した三次元構造を持っているため、平面外の顔の動きも合成できます。 顔プロファイルF(-)は、もともと大ポーズ顔アライメント問題を解決するために提案されたものであり、顔のヨー角∆φとピッチ角∆γを徐々に大きくするために使用されます。 具体的には、複数の静止画像が小さなバッチでサンプリングされ、各静止画像 x0 に対してわずかに平滑化された変換が実行され、n 個の隣接するフレームを持つ合成ビデオが生成されます。 3D アシストの短いビデオ合成フレームで 2 つの隣接するフレームを合成する方法: 始め方現在、チームは 3DDFA-V2 をオープンソース化しており、インストールと使用が非常に簡単です。 インストール手順:
インストールが完了したら、NMS と Sim3DR の Cython バージョンをビルドする必要があります。
デモを実行します:
例えば、ランニング
次の結果が得られます: 顔の動きの追跡は、位置合わせするだけで実現できます。 ただし、頭の角度が 90° を超えていたり、動きが速すぎたりすると、位置合わせに失敗する可能性があります。しきい値を使用して追跡ステータスを微調整することを検討してください。 読み込んだら、任意の画像を入力として使用してアルゴリズムを実行できます。
ターミナルに出力ログが表示された場合は、操作が成功したことを意味します。結果を待つだけです。
3DDFA-V2 には、コンピューターのハードウェアとソフトウェアに関するいくつかの要件があります。
研究チームが推奨するハードウェア条件は、NVIDIA GTX 1080 GPU とi5-8259U CPU です。 もちろん、Lao Huang のカードだけでなく、Google Colab で直接体験することもできます。 このツールが役に立つなら、ぜひ試してみてください。 3DDFA-V2 Google コラボ: Github プロジェクト アドレス: |
>>: 技術的負債の高利クレジットカード: 最もよく知られているエンドツーエンドの機械学習プラットフォームを詳しく調べる
頭に貼るビジョンプロは人から人へと広がっています。これがロンドンの街の最新風景です。 「刺激が欲しけ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[210667]]昨年、DeepMindのAlphaGoは世界囲碁チャンピオンのイ・セドルを4対1...
コンピュータが人間の囲碁の名人と対戦していたとき、コンピュータは数年連続で世界チャンピオンに勝つこと...
[[263087]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
2021 年には技術変化のペースが加速し、歴史が示すように、2022 年もそのペースは加速し続けるで...
ビッグデータ技術は画像認識や遺伝子配列解析などの分野で先駆的な役割を果たしており、インテリジェントロ...
AIを活用して企業業務の自動化プロセスを加速し、デジタルトランスフォーメーションや業務プロセスのアッ...
プラットフォーム経済の急速な発展に伴い、オンラインショッピング、交通、旅行宿泊、食品配達、オンライン...
国内企業におけるAI導入の現状アクセンチュアが世界各国の企業幹部を対象に実施した「中国企業はどのよう...
さまざまなアルゴリズムの実装やソフトウェア パッケージがオープン ソースで利用できる世界において、ア...
[[440057]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...
1. GNN推奨システムの基礎となる計算能力の進化過去 20 年間にわたり、コンピューティングは進化...