スケッチが本物の顔に変わる？ AI: はい、草はいくらでも大丈夫です。

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

絵が苦手でも、リアルな肖像画を描きたいと思いませんか？

それは可能です。

YouTube のある人が、簡単な小さなプログラムでそれを実現しました!

効果はかなり良いです！解像度とリアリティがすべて揃っています。

スケッチはこんな感じです...

くそ。

AIによる顔生成は絵が下手な人でも使える

最初のグループが最初の戦いに勝利し、その男性は性別を変えてみることにしました。

はい、性別認識は成功しました✅、でもちょっと「不気味」に見えます。

誰かを責めたいなら、その人の「魂」の絵画技術を責めればいいのです…

次のグループ——

著者は顔、髪、目などを徐々に描き、AI が段階的に肖像画を生成する様子を皆さんに示します。

細部が充実するとともに、顔も豊かになるように訓練されているようです。

次に、作者は想像力を豊かにして、実際に三角形/マンゴー型/四角形/洋ナシ型の顔を描いてみました...

故障するのでしょうか？

いいえ！

顔の形がどうであろうと、耳が曲がっていようと、目がつり上がっていようと、彼は成功した。結果には非常に満足しました。写真の 1 枚は実際にかなり良く見えました。

さて、ナルトを描いてみるのはどうでしょうか？

ナルトは現実世界ではどのように見えるでしょうか?

[[393649]]

ヘルプ！ 🆘! ！！

…

その後、兄弟はさらに 2 つのグループを作りました。

△マインクラフトのスティーブのAIポートレート：ファンファンの髪の毛が復元される

△漫画キャラクター、リック・サンチェスのAIポートレート：マイケル・ジャクソンに似てる？

AI は基本的に元のキャラクターのしわや肌の色を再現できることに気付きましたか? さらに、上のナルトの AI アバターも「偶然」黄色い髪をしています。

とても魔法のようですね？

しかし著者は冗談を言った。「それは魔法だよ…」

論文に触発されて

このアイデアを提案し、プログラムを実装したのは、オンライン名「Stochastic Machine」（ランダムマシン？）を持つ人物です。

ある論文に触発されて——

《スタイルでエンコード: 画像から画像への変換のための StyleGAN エンコーダー》

この論文では、技術者が styleGAN 上でディープニューラルネットワークをトレーニングし、ソース画像を styleGAN モデルの入力にマッピングして、最終的に高品質のターゲット画像を出力する方法を学習させる方法について説明します。

興味深い例が3つあります。

1. 横顔を対応する正面顔として出力する（顔の正面化）

2. ぼやけた顔を高解像度の顔に生成する（超解像度）

しかし、最も近い外観を復元する方法は複数あります。

3. 条件付き画像合成。これはpix2pixに非常に似ています。

エンコーダーは手描きまたは顔のマスクを入力し、一連の高解像度の実物の肖像画を生成できます。

Pix2pixはGANに基づいて設計されたアルゴリズムです。ペア画像の変換を完了し、より鮮明な結果を得ることができます。

生成的敵対ネットワークである GAN (Generative Adversarial Networks) は、ディープラーニングモデルであり、近年の複雑な分布に対する教師なし学習の最も有望な方法の 1 つです。

若者は最後の効果に大いに満足し、興味を示した。そしてこう考えました。

落書きするだけで非常にリアルな AI の顔を生成する簡単なプログラムを作成できるかもしれません。

彼はすぐにそれを実行しました。彼は以前、pix2pix 技術に基づいてスケッチから顔を生成するプログラムを開発していました。

残念ながら、その効果はそれとは程遠いものです。まったく人間ではありません!

彼は、オリジナルのコードとこの論文の技術を組み合わせて、このようなシンプルなアプリケーションを作成しました。絵を描くスキルがどんなに下手でも、リアルな AI の顔を生成できます。

AI顔生成技術：ぼやけたものから本物と偽物の区別がつかないものまで

当初、多くの AI 顔生成作業 (GAN テクノロジに基づく) は、人間の顔の全体的な外観をかろうじて模倣することしかできず、多かれ少なかれ「曖昧」(品質が欠けている) でした。

言うまでもなく、生成されたポートレートの一部は単なる白黒です。

2019年、StyleGANの登場により、AI画像生成技術は大きく前進しました。

この技術によって生成された肖像画は、ついに「言わなければ、私が AI だとは分からない」ほどリアルになりました。

StyleGANはGANをベースに開発されたモデルです。

StyleGANにおける「スタイル」とは、顔の形や髪型など人間の顔のさまざまな属性のほか、顔の肌の色やシワの有無などの詳細を指します。異なる「ペイント方法」により、顔の異なる「スタイル」を正確に制御できます。

上記の「ランダムマシン」の人が使用した StyleGAN2 は、StyleGAN の改良版です。

この技術に基づく顔生成のアプリケーションは無数にあります。このツールの最大の違いは、ベースマップに従ってコピーして処理する必要がなく、優れたペイントスキルも必要ないことです。より多くの「魂」が、対応する非常にリアルな肖像画を生成できます。

しかし、このプログラムによって生成された肖像画は、インド（亜大陸）で一般的な顔の特徴をほとんど備えていると言う人もいます。

もちろん、これらはすべて対応するデータセット (CelebA-HQ) でのトレーニングの結果であると彼は言いました。

<<: 人工知能は気候変動に対する新時代の解決策である

>>: ディープラーニングアルゴリズム

汎用聴覚AIのロックを解除します！清華大学電子工学部とVolcano Voiceが共同で新しい認知指向の聴覚言語モデルをオープンソース化

ブログ

スケッチが本物の顔に変わる？ AI: はい、草はいくらでも大丈夫です。

AIによる顔生成は絵が下手な人でも使える

AI顔生成技術：ぼやけたものから本物と偽物の区別がつかないものまで

汎用聴覚AIのロックを解除します！清華大学電子工学部とVolcano Voiceが共同で新しい認知指向の聴覚言語モデルをオープンソース化

「AI」の限界：人工知能は未来を変えるが、まだ解決されていない問題がある

Intel と AMD はパフォーマンスの向上のために AI PC に期待していますが、消費者はそれらを買い替える資金を持っているのでしょうか?

AIも催眠術をかけられるのか？

アートデザインにおける人工知能

企業は2024年に台頭するテクノロジーの波にどのように対応すべきでしょうか?

機械学習 | PyTorch 簡潔チュートリアルパート 2

推薦する

3 人のインド人が圧縮アルゴリズムを変更し、夏の間ずっとそれを実行することを主張しましたが、単純な理由で資金を調達できませんでした。

顔認識はどれくらい強力ですか? AIFRテクノロジーはあなたを数分で「スター」に変えます

650億のパラメータ、すべてのパラメータを8つのGPUで微調整可能：Qiu Xipengのチームは大規模モデルの閾値を下げました

2021年の主なAIトレンド：AIチップスタートアップのM&Aの可能性

2024年にIT業界は成長を遂げる：AIとサイバーセキュリティが最大のホットスポット

CMU の専門家が「マルチモーダル機械学習」の 6 つの主要な課題を包括的にまとめています。36 ページの長い記事 + 120 ページの PPT、すべて実用的な情報です。

AIがハッカーを騙すために偽の文書を作成

企業は人工知能の可能性に目がくらんでいるのでしょうか?

LLaVA: GPT-4V(ision) のオープンソース代替品

あなたはまだこれらの仕事をしていますか？マシンビジョンと人工知能により、今後10年間で失業することになるかもしれません