デュアルスタイルGAN高解像度のポートレートスタイル転送アルゴリズム 実在の人物の写真 画像A これは変更するスタイルである別の画像 写真B アルゴリズムは画像 画像C この効果はかなり良いですよね? このようにして、お気に入りのアニメキャラクターに合わせて、自分の肖像画のスタイルを転送することができます。 アルゴリズムの影響をさらに見てみましょう。 最初の列は元の画像、2 番目の列は参照スタイル、3 番目の列はアルゴリズムによって生成された効果です。 このアルゴリズムは、アバターが必要ないくつかのシナリオに適用でき、ユーザーにオプションのコミック スタイルを提供して、お気に入りのポートレートを生成できます。
公式アルゴリズムでは 3 つの方法が提供されています。 プログラミングの知識がない友達でもWebページを体験できます。
試すには写真をアップロードしてください。 他の 2 つは、Colab 環境とローカル ビルドです。 Colab では、サードパーティの依存関係を自分でインストールする必要はなく、直接開いて実行できる「ラダー」があります。
ローカルでテストしたい友人もローカルにデプロイできます。公式のConda環境が提供されており、仮想環境を直接作成できます。 conda env 作成-f ./environment/dualstylegan_env.yaml 詳しい情報については、 最後に、素晴らしいエフェクトのセットをご紹介します。 RQ-VAEトランス私の記事をよく読んでいる友人は、私が書いた NÜWA (Nu Wa) と DALL-E アルゴリズムを読んでいるはずです。 今日紹介するアルゴリズム タスクは、テキストの説明に基づいて、説明に対応する画像を生成することです。 例えば: 雪山を前にチーズバーガー。 アルゴリズムは、テキストの説明に基づいて対応する画像を生成します。 例えば: 青い海に咲く桜。 アルゴリズムは主に RQ-VAE と RQ-Transformer の 2 つの段階に分かれています。 前者はエンコードを担当し、後者は生成を担当します。 このアルゴリズムはオープンソース化されました:
このプロジェクトはローカル環境のみをサポートします。サードパーティのライブラリは、 pip インストール-r要件.txt ぜひ試してみてください。いくつかの効果は非常に興味深いものです。 蛍光表示管ディープフェイクの顔を変える技術はますます一般的になりつつあります。 顔交換の写真やビデオは非常にリアルなので、肉眼では判別が難しい場合があります。 これも CVPR 2022 であり、オープンソース化されたばかりです。 効果については、ご自身でテストしていただけます。
チャッター2022年のCVPRを見ると、3D再構築やTransformerに関する内容が多かったですね。 状況に応じて、後ほど 3D 再構築を共有します。 |
<<: トレーニングは不要、自動的にスケーラブルなビジュアルトランスフォーマーが登場
0×00 背景形式手法は、私たちのほとんどにとっては非常に高度なものです。せいぜい授業で聞いたこと...
[[257419]] 2018 年は人工知能 (AI) の主流採用をさらに促進し、より多くの機能の提...
人工知能 (AI) は間違いなく 2010 年代のテクノロジーのテーマであり、新しい 10 年が始ま...
あなたがエンジニアであり、コンピューターをゼロから設計する任務を負っていると想像してください。ある日...
11月4日、北京青年報などのメディアの報道によると、国内初となる省レベルのヒューマノイドロボットイ...
1. 大規模言語モデル推論の概要従来の CNN モデル推論とは異なり、大規模言語モデルの推論は通常、...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
11月7日、ゼネラルモーターズの自動運転会社クルーズは、自動運転タクシーは4~5マイルごとに人間の支...
インテルは、人工知能、ロボット工学などの分野におけるニューロモルフィック・コンピューティングの研究開...
[51CTO.com からのオリジナル記事] オブジェクト指向の時代では、すべてがオブジェクトである...
最近、当社の自動運転デビューがニュースで取り上げられており、ADS はついに謎の組織ではなくなりまし...