スケッチが本物の顔に変わる? AI: はい、草はいくらでも大丈夫です。

スケッチが本物の顔に変わる? AI: はい、草はいくらでも大丈夫です。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

絵が苦手でも、リアルな肖像画を描きたいと思いませんか?

それは可能です。

YouTube のある人が、簡単な小さなプログラムでそれを実現しました!

効果はかなり良いです!解像度とリアリティがすべて揃っています。

スケッチはこんな感じです...

くそ。

AIによる顔生成は絵が下手な人でも使える

最初のグループが最初の戦いに勝利し、その男性は性別を変えてみることにしました。

はい、性別認識は成功しました✅、でもちょっと「不気味」に見えます。

誰かを責めたいなら、その人の「魂」の絵画技術を責めればいいのです…

次のグループ——

著者は顔、髪、目などを徐々に描き、AI が段階的に肖像画を生成する様子を皆さんに示します。

細部が充実するとともに、顔も豊かになるように訓練されているようです。

次に、作者は想像力を豊かにして、実際に三角形/マンゴー型/四角形/洋ナシ型の顔を描いてみました...

故障するのでしょうか?

いいえ!

顔の形がどうであろうと、耳が曲がっていようと、目がつり上がっていようと、彼は成功した。結果には非常に満足しました。写真の 1 枚は実際にかなり良く見えました。

さて、ナルトを描いてみるのはどうでしょうか?

ナルトは現実世界ではどのように見えるでしょうか?

[[393649]]

ヘルプ! 🆘! ! !

その後、兄弟はさらに 2 つのグループを作りました。

△マインクラフトのスティーブのAIポートレート:ファンファンの髪の毛が復元される

△漫画キャラクター、リック・サンチェスのAIポートレート:マイケル・ジャクソンに似てる?

AI は基本的に元のキャラクターのしわや肌の色を再現できることに気付きましたか? さらに、上のナルトの AI アバターも「偶然」黄色い髪をしています。

とても魔法のようですね?

しかし著者は冗談を言った。「それは魔法だよ…」

論文に触発されて

このアイデアを提案し、プログラムを実装したのは、オンライン名「Stochastic Machine」(ランダムマシン?)を持つ人物です。

ある論文に触発されて——

《スタイルでエンコード: 画像から画像への変換のための StyleGAN エンコーダー》

この論文では、技術者が styleGAN 上でディープ ニューラル ネットワークをトレーニングし、ソース画像を styleGAN モデルの入力にマッピングして、最終的に高品質のターゲット画像を出力する方法を学習させる方法について説明します。

興味深い例が3つあります。

1. 横顔を対応する正面顔として出力する(顔の正面化)

2. ぼやけた顔を高解像度の顔に生成する(超解像度)

しかし、最も近い外観を復元する方法は複数あります。

3. 条件付き画像合成。これはpix2pixに非常に似ています。

エンコーダーは手描きまたは顔のマスクを入力し、一連の高解像度の実物の肖像画を生成できます。

Pix2pixはGANに基づいて設計されたアルゴリズムです。ペア画像の変換を完了し、より鮮明な結果を得ることができます。

生成的敵対ネットワークである GAN (Generative Adversarial Networks) は、ディープラーニング モデルであり、近年の複雑な分布に対する教師なし学習の最も有望な方法の 1 つです。

若者は最後の効果に大いに満足し、興味を示した。そしてこう考えました。

落書きするだけで非常にリアルな AI の顔を生成する簡単なプログラムを作成できるかもしれません。

彼はすぐにそれを実行しました。彼は以前、pix2pix 技術に基づいてスケッチから顔を生成するプログラムを開発していました。

残念ながら、その効果はそれとは程遠いものです。まったく人間ではありません!

彼は、オリジナルのコードとこの論文の技術を組み合わせて、このようなシンプルなアプリケーションを作成しました。絵を描くスキルがどんなに下手でも、リアルな AI の顔を生成できます。

AI顔生成技術:ぼやけたものから本物と偽物の区別がつかないものまで

当初、多くの AI 顔生成作業 (GAN テクノロジに基づく) は、人間の顔の全体的な外観をかろうじて模倣することしかできず、多かれ少なかれ「曖昧」(品質が欠けている) でした。

言うまでもなく、生成されたポートレートの一部は単なる白黒です。

2019年、StyleGANの登場により、AI画像生成技術は大きく前進しました。

この技術によって生成された肖像画は、ついに「言わなければ、私が AI だとは分からない」ほどリアルになりました。

StyleGANはGANをベースに開発されたモデルです。

StyleGANにおける「スタイル」とは、顔の形や髪型など人間の顔のさまざまな属性のほか、顔の肌の色やシワの有無などの詳細を指します。異なる「ペイント方法」により、顔の異なる「スタイル」を正確に制御できます。

上記の「ランダム マシン」の人が使用した StyleGAN2 は、StyleGAN の改良版です。

この技術に基づく顔生成のアプリケーションは無数にあります。このツールの最大の違いは、ベースマップに従ってコピーして処理する必要がなく、優れたペイントスキルも必要ないことです。より多くの「魂」が、対応する非常にリアルな肖像画を生成できます。

しかし、このプログラムによって生成された肖像画は、インド(亜大陸)で一般的な顔の特徴をほとんど備えていると言う人もいます。

もちろん、これらはすべて対応するデータセット (CelebA-HQ) でのトレーニングの結果であると彼は言いました。

<<:  人工知能は気候変動に対する新時代の解決策である

>>:  ディープラーニングアルゴリズム

推薦する

LLMLingua: LlamaIndex を統合してプロンプトを圧縮し、大規模な言語モデルに効率的な推論を提供します。

大規模言語モデル (LLM) の出現により、複数の分野でイノベーションが促進されました。しかし、思考...

RSA アルゴリズムが解読された場合、暗号化の将来はどうなるでしょうか?

インターネットのセキュリティ層に一夜にして巨大な亀裂が生じたらどうなるか考えたことがありますか? 亀...

機械学習に必須の Python ライブラリ トップ 10

[51CTO.com クイック翻訳] 現在、Python は人気があり広く使用されているプログラミ...

専門家の意見: AIアプリケーションでは、ビッグデータよりもワイドデータが価値がある

今日の急速に変化するデジタル世界では、データの使用は進化し続けており、企業は構造化データと非構造化デ...

AI導入時に解決すべき無線ネットワークの運用・保守における4つの大きな課題

無線通信ネットワークの発展に伴い、今後のネットワークは周波数帯域やネットワーク構成の面でより複雑化し...

AIと自動化を活用して機密データを大規模に識別する方法

AIベースの機密情報検出サービスプロバイダーであるText IQのCEO、Apoorv Agarwa...

AI実践者が適用すべき10のディープラーニング手法

過去 10 年間で、機械学習への関心は爆発的に高まりました。ほぼ毎日、さまざまなコンピューターサイエ...

...

調査によると、ChatGPTが提供するアドバイスは専門家が提供するアドバイスよりも包括的で役立つことがわかっています。

12月26日、専門家が実施した最近の調査では、ChatGPTが提供する提案は、人間の専門家が提供す...

一般的な機械学習アルゴリズム11種の紹介

近年、需要の高さと技術の進歩により、機械学習の人気は大幅に高まっています。 データから価値を生み出す...

単一の画像ガイド、主題を保持し、スタイルを変更する、VCTはそれを簡単に実現するのに役立ちます

近年、画像生成技術は多くの重要な進歩を遂げました。特に、DALLE2やStable Diffusio...

...

ライブクイズゲーム「Winning with Ease」は止められない、Baidu AIが150万の現金獲得にあなたを招待します!

「2進数では、1+1=?」答えが2の場合、残念ながら150万を逃してしまいます。これは頭​​の体操...

...

香港最大のAI詐欺事件!ディープフェイクが「英国人CFO」の顔をすり替え、同社から2億香港ドルを直接詐取

ここ数日、古くからあるAIアプリケーション「AI変顔」が何度も話題となり、ホットな検索ワードに何度も...