興味深い AI アルゴリズムをいくつかお勧めします。とても面白いです!

興味深い AI アルゴリズムをいくつかお勧めします。とても面白いです!

デュアルスタイルGAN

高解像度のポートレートスタイル転送アルゴリズム​DualStyleGAN​​ ​。

実在の人物の写真​A​が与えられた場合:

画像A

これは変更するスタイルである別の画像​B​です。

写真B

アルゴリズムは画像​A​のスタイルを画像​B​のスタイルに従って転送し、画像​C​を生成します。

画像C

この効果はかなり良いですよね?

このようにして、お気に入りのアニメキャラクターに合わせて、自分の肖像画のスタイルを転送することができます。

アルゴリズムの影響をさらに見てみましょう。

最初の列は元の画像、2 番目の列は参照スタイル、3 番目の列はアルゴリズムによって生成された効果です。

このアルゴリズムは、アバターが必要ないくつかのシナリオに適用でき、ユーザーにオプションのコミック スタイルを提供して、お気に入りのポートレートを生成できます。

​DualStyleGAN​アルゴリズムはオープンソース化されたばかりで、約​300​スターを獲得しています。

プロジェクトアドレス:

https://github.com/williamyang1991/デュアルスタイルGAN

公式アルゴリズムでは 3 つの方法が提供されています。

プログラミングの知識がない友達でもWebページを体験できます。

https://huggingface.co/spaces/hysts/DualStyleGAN

試すには写真をアップロードしてください。

他の 2 つは、Colab 環境とローカル ビルドです。

Colab では、サードパーティの依存関係を自分でインストールする必要はなく、直接開いて実行できる「ラダー」があります。

https://colab.research.google.com/github/williamyang1991/DualStyleGAN/blob/master/notebooks/inference_playground.ipynb

ローカルでテストしたい友人もローカルにデプロイできます。公式のConda環境が提供されており、仮想環境を直接作成できます。

 conda env 作成-f ./environment/dualstylegan_env.yaml

詳しい情報については、 ​README​を直接お読みください。

最後に、素晴らしいエフェクトのセットをご紹介します。

RQ-VAEトランス

私の記事をよく読んでいる友人は、私が書いた NÜWA (Nu Wa) と DALL-E アルゴリズムを読んでいるはずです。

今日紹介するアルゴリズム​RQ-VAE Transformer​テキストを画像に変換するタスクで優れたパフォーマンスを発揮します。

タスクは、テキストの説明に基づいて、説明に対応する画像を生成することです。

例えば:

​A cheeseburger in front of a mountain range covered with snow.​

雪山を前にチーズバーガー。

アルゴリズムは、テキストの説明に基づいて対応する画像を生成します。

例えば:

​a cherry blossom tree on the blue ocean.​

青い海に咲く桜。

アルゴリズムは主に RQ-VAE と RQ-Transformer の 2 つの段階に分かれています。

前者はエンコードを担当し、後者は生成を担当します。

このアルゴリズムはオープンソース化されました:

プロジェクトアドレス:

https://github.com/kakaobrain/rq-vae-transformer

このプロジェクトはローカル環境のみをサポートします。サードパーティのライブラリは、 ​requirements​に応じて直接インストールできます。

 pip インストール-r要件.txt

ぜひ試してみてください。いくつかの効果は非常に興味深いものです。

蛍光表示管

ディープフェイクの顔を変える技術はますます一般的になりつつあります。

顔交換の写真やビデオは非常にリアルなので、肉眼では判別が難しい場合があります。

​VFD​技術的な手段を通じて写真の信憑性を分析するのに役立ちます。

これも CVPR 2022 であり、オープンソース化されたばかりです。

効果については、ご自身でテストしていただけます。

プロジェクトアドレス:

https://github.com/xaCheng1996/VFD

チャッター

2022年のCVPRを見ると、3D再構築やTransformerに関する内容が多かったですね。

状況に応じて、後ほど 3D 再構築を共有します。

<<:  トレーニングは不要、自動的にスケーラブルなビジュアルトランスフォーマーが登場

>>:  人工知能は鉄道の乗客の安全を守ることができるか?

ブログ    
ブログ    
ブログ    

推薦する

人工知能を導入できるいくつかのアプリケーション

人工知能は長年にわたって世界を支配しており、さまざまな分野における主要な問題が AI を使用して解決...

極端なケースによって引き起こされた議論: アルゴリズムがあなたが死にたいと考えた時...

悲しい話です。2017年、14歳のイギリスの少女モリー・ラッセルが予期せず自殺を選択しました。このよ...

アリババ、量子アルゴリズムとエラー訂正の探究をサポートする量子シミュレータ「Taizhang 2.0」をオープンソース化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

ニューラルネットワークと数学の関係は何ですか?読めば分かるよ

ニューラル ネットワークについて学んだことのある人なら誰でも、ニューラル ネットワークには非常に一般...

非常に便利な無料データマイニングツール 19 個のコレクション!

今日の世界では、データはお金を意味します。アプリベースの世界への移行に伴い、データは飛躍的に増加して...

...

IBM CEOがパートナーに「一緒にAIで大儲けしましょう」

IBM CEO の Arvind Krishna 氏は CRN とのインタビューで、今年 IBM ...

クラウド上でのインテリジェント運転の 3D 再構築のベスト プラクティス

インテリジェント運転技術の継続的な発展により、私たちの移動方法や交通システムは変化しています。 3D...

物流業界を変える7つの技術トレンド

近年、新型コロナウイルスやロシア・ウクライナ戦争、エネルギー危機など、世界規模の問題が次々と発生し、...

人工知能による空中戦闘の時代が到来し、エースパイロットは職を失うことになるのだろうか?

最近、J-10やJ-20など我が国の先進的な国産戦闘機の開発に成功した中国航空工業集団の成都航空機設...

...

QQがスーパーQQショーを開始:3D HDモデルが顔認識AIフェイスピンチをサポート

2月10日、QQ誕生23周年にあたり、テンセントQQチームは、これまでのテスト段階を経て、スーパー...

AIがDevOpsを加速させる10の方法

今年初めに発表されたデロイトのレポートによると、AIベースのソフトウェア開発ツールを提供するスタート...