デュアルスタイルGAN高解像度のポートレートスタイル転送アルゴリズム 実在の人物の写真 画像A これは変更するスタイルである別の画像 写真B アルゴリズムは画像 画像C この効果はかなり良いですよね? このようにして、お気に入りのアニメキャラクターに合わせて、自分の肖像画のスタイルを転送することができます。 アルゴリズムの影響をさらに見てみましょう。 最初の列は元の画像、2 番目の列は参照スタイル、3 番目の列はアルゴリズムによって生成された効果です。 このアルゴリズムは、アバターが必要ないくつかのシナリオに適用でき、ユーザーにオプションのコミック スタイルを提供して、お気に入りのポートレートを生成できます。
公式アルゴリズムでは 3 つの方法が提供されています。 プログラミングの知識がない友達でもWebページを体験できます。
試すには写真をアップロードしてください。 他の 2 つは、Colab 環境とローカル ビルドです。 Colab では、サードパーティの依存関係を自分でインストールする必要はなく、直接開いて実行できる「ラダー」があります。
ローカルでテストしたい友人もローカルにデプロイできます。公式のConda環境が提供されており、仮想環境を直接作成できます。 conda env 作成-f ./environment/dualstylegan_env.yaml 詳しい情報については、 最後に、素晴らしいエフェクトのセットをご紹介します。 RQ-VAEトランス私の記事をよく読んでいる友人は、私が書いた NÜWA (Nu Wa) と DALL-E アルゴリズムを読んでいるはずです。 今日紹介するアルゴリズム タスクは、テキストの説明に基づいて、説明に対応する画像を生成することです。 例えば: 雪山を前にチーズバーガー。 アルゴリズムは、テキストの説明に基づいて対応する画像を生成します。 例えば: 青い海に咲く桜。 アルゴリズムは主に RQ-VAE と RQ-Transformer の 2 つの段階に分かれています。 前者はエンコードを担当し、後者は生成を担当します。 このアルゴリズムはオープンソース化されました:
このプロジェクトはローカル環境のみをサポートします。サードパーティのライブラリは、 pip インストール-r要件.txt ぜひ試してみてください。いくつかの効果は非常に興味深いものです。 蛍光表示管ディープフェイクの顔を変える技術はますます一般的になりつつあります。 顔交換の写真やビデオは非常にリアルなので、肉眼では判別が難しい場合があります。 これも CVPR 2022 であり、オープンソース化されたばかりです。 効果については、ご自身でテストしていただけます。
チャッター2022年のCVPRを見ると、3D再構築やTransformerに関する内容が多かったですね。 状況に応じて、後ほど 3D 再構築を共有します。 |
<<: トレーニングは不要、自動的にスケーラブルなビジュアルトランスフォーマーが登場
人工知能は長年にわたって世界を支配しており、さまざまな分野における主要な問題が AI を使用して解決...
悲しい話です。2017年、14歳のイギリスの少女モリー・ラッセルが予期せず自殺を選択しました。このよ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[437774]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
ニューラル ネットワークについて学んだことのある人なら誰でも、ニューラル ネットワークには非常に一般...
今日の世界では、データはお金を意味します。アプリベースの世界への移行に伴い、データは飛躍的に増加して...
IBM CEO の Arvind Krishna 氏は CRN とのインタビューで、今年 IBM ...
インテリジェント運転技術の継続的な発展により、私たちの移動方法や交通システムは変化しています。 3D...
近年、新型コロナウイルスやロシア・ウクライナ戦争、エネルギー危機など、世界規模の問題が次々と発生し、...
最近、J-10やJ-20など我が国の先進的な国産戦闘機の開発に成功した中国航空工業集団の成都航空機設...
2月10日、QQ誕生23周年にあたり、テンセントQQチームは、これまでのテスト段階を経て、スーパー...
今年初めに発表されたデロイトのレポートによると、AIベースのソフトウェア開発ツールを提供するスタート...