興味深い AI アルゴリズムをいくつかお勧めします。とても面白いです!

デュアルスタイルGAN

高解像度のポートレートスタイル転送アルゴリズムDualStyleGAN 。

実在の人物の写真Aが与えられた場合：

画像A

これは変更するスタイルである別の画像Bです。

写真B

アルゴリズムは画像Aのスタイルを画像Bのスタイルに従って転送し、画像Cを生成します。

画像C

この効果はかなり良いですよね？

このようにして、お気に入りのアニメキャラクターに合わせて、自分の肖像画のスタイルを転送することができます。

アルゴリズムの影響をさらに見てみましょう。

最初の列は元の画像、2 番目の列は参照スタイル、3 番目の列はアルゴリズムによって生成された効果です。

このアルゴリズムは、アバターが必要ないくつかのシナリオに適用でき、ユーザーにオプションのコミックスタイルを提供して、お気に入りのポートレートを生成できます。

DualStyleGANアルゴリズムはオープンソース化されたばかりで、約300スターを獲得しています。

プロジェクトアドレス:
https://github.com/williamyang1991/デュアルスタイルGAN

公式アルゴリズムでは 3 つの方法が提供されています。

プログラミングの知識がない友達でもWebページを体験できます。

https://huggingface.co/spaces/hysts/DualStyleGAN

試すには写真をアップロードしてください。

他の 2 つは、Colab 環境とローカルビルドです。

Colab では、サードパーティの依存関係を自分でインストールする必要はなく、直接開いて実行できる「ラダー」があります。

https://colab.research.google.com/github/williamyang1991/DualStyleGAN/blob/master/notebooks/inference_playground.ipynb

ローカルでテストしたい友人もローカルにデプロイできます。公式のConda環境が提供されており、仮想環境を直接作成できます。

 conda env 作成-f ./environment/dualstylegan_env.yaml

詳しい情報については、 READMEを直接お読みください。

最後に、素晴らしいエフェクトのセットをご紹介します。

RQ-VAEトランス

私の記事をよく読んでいる友人は、私が書いた NÜWA (Nu Wa) と DALL-E アルゴリズムを読んでいるはずです。

今日紹介するアルゴリズムRQ-VAE Transformerテキストを画像に変換するタスクで優れたパフォーマンスを発揮します。

タスクは、テキストの説明に基づいて、説明に対応する画像を生成することです。

例えば：

A cheeseburger in front of a mountain range covered with snow.

雪山を前にチーズバーガー。

アルゴリズムは、テキストの説明に基づいて対応する画像を生成します。

例えば：

a cherry blossom tree on the blue ocean.

青い海に咲く桜。

アルゴリズムは主に RQ-VAE と RQ-Transformer の 2 つの段階に分かれています。

前者はエンコードを担当し、後者は生成を担当します。

このアルゴリズムはオープンソース化されました:

プロジェクトアドレス:
https://github.com/kakaobrain/rq-vae-transformer

このプロジェクトはローカル環境のみをサポートします。サードパーティのライブラリは、 requirementsに応じて直接インストールできます。

 pip インストール-r要件.txt

ぜひ試してみてください。いくつかの効果は非常に興味深いものです。

蛍光表示管

ディープフェイクの顔を変える技術はますます一般的になりつつあります。

顔交換の写真やビデオは非常にリアルなので、肉眼では判別が難しい場合があります。

VFD技術的な手段を通じて写真の信憑性を分析するのに役立ちます。

これも CVPR 2022 であり、オープンソース化されたばかりです。

効果については、ご自身でテストしていただけます。

プロジェクトアドレス:
https://github.com/xaCheng1996/VFD

チャッター

2022年のCVPRを見ると、3D再構築やTransformerに関する内容が多かったですね。

状況に応じて、後ほど 3D 再構築を共有します。

<<: トレーニングは不要、自動的にスケーラブルなビジュアルトランスフォーマーが登場

>>: 人工知能は鉄道の乗客の安全を守ることができるか？

人工知能と機械学習 – これらの流行語を理解していますか?

ブログ

3大ニューラルネットワークから、TensorFlow、MXNet、CNTK、Theanoの4つのフレームワークをテストして比較します。

ブログ

人工知能の登場により、私たちは仕事を維持できるのでしょうか?

ブログ

スマート、インテリジェントなインタラクティブ推奨システムと販売前ショッピングガイドロボットをリリース

ブログ

寒い冬の「火」、快手は流行に逆らって1,000人以上を募集

ブログ

プログラマーを夢中にさせるソートアルゴリズムに関するビデオ

ブログ

2020年に人工知能はどのように発展するでしょうか?機械学習のトップ専門家が予測するトレンド

ブログ

人工知能は本当に万能なのでしょうか？

ブログ

ChatGPTのメタバージョンが登場: Llama 2がサポートされ、Bing検索に接続され、ザッカーバーグがライブでデモを実施

ブログ

興味深い AI アルゴリズムをいくつかお勧めします。とても面白いです!

デュアルスタイルGAN

RQ-VAEトランス

蛍光表示管

チャッター

人工知能と機械学習 – これらの流行語を理解していますか?

3大ニューラルネットワークから、TensorFlow、MXNet、CNTK、Theanoの4つのフレームワークをテストして比較します。

人工知能の登場により、私たちは仕事を維持できるのでしょうか?

スマート、インテリジェントなインタラクティブ推奨システムと販売前ショッピングガイドロボットをリリース

寒い冬の「火」、快手は流行に逆らって1,000人以上を募集

プログラマーを夢中にさせるソートアルゴリズムに関するビデオ

2020年に人工知能はどのように発展するでしょうか?機械学習のトップ専門家が予測するトレンド

人工知能は本当に万能なのでしょうか？

ChatGPTのメタバージョンが登場: Llama 2がサポートされ、Bing検索に接続され、ザッカーバーグがライブでデモを実施

推薦する

13歳の天才少年がAIスピーカーを開発。2010年代以降の世代は単純ではない

一つの時代が終わった！ Google の「ゴッドファーザー」エリック・シュミット氏が同社を去る。彼はどのようにして Google 帝国を築き上げたのか?

Web アプリケーション向けビジネスチャットボット 12 選

火星探査車「パーセベランス」の火星着陸における人工知能の応用

国内大学、AI専攻の学部生を初めて大規模募集

ゲームAIの課題が進み、リアルタイム戦略ゲームや不完全情報ゲームがホットスポットに

生成AI技術の原理を深く理解する: 生成AIの入門

Midjourney V6は大幅に進化しており、トップネットユーザーによる徹底レビューがここにあります!画質は恐ろしいほどリアルで、ポートレート写真は素晴らしいです

古典的な構造から改良された方法まで、ニューラルネットワーク言語モデルのレビュー

Jupyterは、コードを書くだけでなく、さまざまな大規模モデルを呼び出すことができる無料のAIアシスタントをリリースしました

30年以上前の主張が覆された？大規模モデルは人間レベルのシステム一般化能力を持つ