デュアルスタイルGAN高解像度のポートレートスタイル転送アルゴリズム 実在の人物の写真 画像A これは変更するスタイルである別の画像 写真B アルゴリズムは画像 画像C この効果はかなり良いですよね? このようにして、お気に入りのアニメキャラクターに合わせて、自分の肖像画のスタイルを転送することができます。 アルゴリズムの影響をさらに見てみましょう。 最初の列は元の画像、2 番目の列は参照スタイル、3 番目の列はアルゴリズムによって生成された効果です。 このアルゴリズムは、アバターが必要ないくつかのシナリオに適用でき、ユーザーにオプションのコミック スタイルを提供して、お気に入りのポートレートを生成できます。
公式アルゴリズムでは 3 つの方法が提供されています。 プログラミングの知識がない友達でもWebページを体験できます。
試すには写真をアップロードしてください。 他の 2 つは、Colab 環境とローカル ビルドです。 Colab では、サードパーティの依存関係を自分でインストールする必要はなく、直接開いて実行できる「ラダー」があります。
ローカルでテストしたい友人もローカルにデプロイできます。公式のConda環境が提供されており、仮想環境を直接作成できます。 conda env 作成-f ./environment/dualstylegan_env.yaml 詳しい情報については、 最後に、素晴らしいエフェクトのセットをご紹介します。 RQ-VAEトランス私の記事をよく読んでいる友人は、私が書いた NÜWA (Nu Wa) と DALL-E アルゴリズムを読んでいるはずです。 今日紹介するアルゴリズム タスクは、テキストの説明に基づいて、説明に対応する画像を生成することです。 例えば: 雪山を前にチーズバーガー。 アルゴリズムは、テキストの説明に基づいて対応する画像を生成します。 例えば: 青い海に咲く桜。 アルゴリズムは主に RQ-VAE と RQ-Transformer の 2 つの段階に分かれています。 前者はエンコードを担当し、後者は生成を担当します。 このアルゴリズムはオープンソース化されました:
このプロジェクトはローカル環境のみをサポートします。サードパーティのライブラリは、 pip インストール-r要件.txt ぜひ試してみてください。いくつかの効果は非常に興味深いものです。 蛍光表示管ディープフェイクの顔を変える技術はますます一般的になりつつあります。 顔交換の写真やビデオは非常にリアルなので、肉眼では判別が難しい場合があります。 これも CVPR 2022 であり、オープンソース化されたばかりです。 効果については、ご自身でテストしていただけます。
チャッター2022年のCVPRを見ると、3D再構築やTransformerに関する内容が多かったですね。 状況に応じて、後ほど 3D 再構築を共有します。 |
<<: トレーニングは不要、自動的にスケーラブルなビジュアルトランスフォーマーが登場
現代のティーンエイジャーにとってクールなものは何でしょうか?おそらくそれは AJ シューズを履くこと...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
[[315528]] [51CTO.com クイック翻訳] ビジネスの発展を推進するために、AI(人...
2月18日に火星への着陸に成功したNASAの火星探査車パーサヴィアランスは、火星での2年間の探査ミッ...
[[233398]] 「人気商品」は受験者や保護者を惹きつけ、専門職の入学基準が引き上げられている大...
前回の 2 つの記事では、ゲーム AI の歴史におけるいくつかの古典的なアルゴリズムと画期的なイベン...
人工知能を単純に目的別に分類すると、意思決定型AIと生成型AIの2つに分けられます。いわゆる意思決定...
最近、Andrei Kovalevという外国人ネットユーザーがMidjourney V6の非常に詳細...
自然言語処理 (NLP) システムのコアコンポーネントとして、言語モデルは単語表現と単語シーケンスの...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人間には「類推による学習」能力があることがわかっています。つまり、新しい概念を学習した後、すぐにそれ...