Nvidia は年末に大きな動きを見せます!強力な画像ジェネレーターStyleGAN2のリリース

Nvidia は年末に大きな動きを見せます!強力な画像ジェネレーターStyleGAN2のリリース

今年初め、NVIDIA の研究エンジニアは、生成的敵対ネットワーク用のスタイルベースのジェネレーター アーキテクチャとして StyleGAN のソース コードをリリースしました。

たとえば、無数のリアルな顔を生成できます。

また、ロリからロイヤルシスターへの変身プロセスを見ることもできます。

強力ではありますが、あくまでも最初のバージョンなので、欠陥があるのは仕方ありません。現在、アップグレード版StyleGAN2が誕生しました。NVIDIAは最近、「StyleGANの画質の分析と改善」という最新の論文を発表しました。StyleGANの生成効果を分析し、不完全な作業に対する改善と最適化の方法を設計しました。どのようなアップグレードがあるのか​​見てみましょう。

1. 機能アーティファクトを排除する

上図に示すように、StyleGAN 画像には水滴に似たアーティファクトがあります。これらは生成時にはあまり目立ちませんが、この問題は常に存在しており、64×64 画像の生成時から存在しています。解像度が高くなるほど、水滴現象は深刻になります。この問題は StyleGAN2 ではもう発生しません。

Nvidia の研究者は StyleGAN アーキテクチャを再設計し、一般的なブロッビー アーティファクトの起源を研究し、ジェネレーターがアーキテクチャの設計上の欠陥を回避するためにそれらを生成していることを発見しました。 NVIDIA は、アーティファクトを除去するためにジェネレーターで使用される正規化を再設計しました。

上図に示すように、(a) は元の StyleGAN アーキテクチャ、(b) は元の StyleGAN アーキテクチャの詳細、(c) は元のアーキテクチャにいくつかの変更を加えたもの、(d) は変更されたアーキテクチャです。

改善後の効果は以下のとおりです。

前述のアーティファクトはなくなり、完全な制御性が維持されます。

2. 詳細生成の改善

StyleGAN で使用されている Progressive Growing トレーニング方法を見てみましょう。詳細は位置に対して強い好みを持っています。特徴が移動しても、位置は変化したりそれに応じて移動したりすることはできません。

StyleGAN 2の研究者が最適化しました。上の図に示すように、upとdownはそれぞれバイリニアアップサンプリングとダウンサンプリングを表しています。歯や目などの特徴が画像上をスムーズに移動すると、その部分が所定の位置に留まり、次に望ましい位置にジャンプすることがあります。下の図は関連するアーティファクトを示しています。生成された顔の特徴は同時に変化することがあります。

一般的に、StyleGAN 2 の改善点は次のとおりです。

生成された画像の品質が大幅に向上しました(FIDスコアが高く、アーティファクトが少ない)

歯や目などの細部をより完璧にする、段階的成長に代わる新しい方法が提案されている

スタイルミキシングの改善

より滑らかな補間(追加の正規化)

より速いトレーニング

力強い感じがしませんか?自分で体験してみませんか? 関連するアドレスは次のとおりです:

論文アドレス: https://arxiv.org/pdf/1912.04958.pdf

Githubアドレス: https://github.com/NVlabs/stylegan2

<<:  2020年AIセキュリティの「技術」と「トレンド」を理解する丨年末レビュー

>>:  人工知能の時代では、プログラマーは排除されるのでしょうか?

ブログ    
ブログ    

推薦する

新しいNeRF技術は、ビデオを簡単に制御できる3Dモデルに変換できます。

翻訳者 |ブガッティレビュー | Chonglou人間の動きが複雑で、環境によって見た目が微妙に異な...

機械学習が戦略ゲームを改善する方法

[[390356]]ポジティブなゲーム体験を生み出すために、ゲームデザイナーはゲーム内のバランスを繰...

高度な機械学習ノート 1 | TensorFlow のインストールと開始方法

[[185581]]導入TensorFlow は、DistBelief に基づいて Google が...

...

GPT-4 が「Who is the Undercover」ボードゲームに大混乱を引き起こします。会話はリアルだが、人間らしさにはまだ改善の余地がある

生成 AI 研究が新たな活力を得ています。韓国チームは、GPT に「Spyfall」と呼ばれるギャン...

AI、VR、ブロックチェーンにより、新しい時代は貧しい人々にとっての楽園となるのでしょうか?

今日の社会では貧困がまだ存在しています。 [[275832]]国連開発計画(UNDP)のデータによる...

クラウドコンピューティングと人工知能が、先進的な企業に前例のない機会を生み出す方法

近年、ますます大規模なデータセットを処理するために SaaS (サービスとしてのソフトウェア) モデ...

XiaoIceが11人のAI歌手を一気にリリース:プロの歌手に匹敵するにはたった45日間のトレーニングが必要

11月25日、 XiaoIceフレームワークは11人のAI歌手をリリースし、アシスタント、同僚、親戚...

ウェブデザインに人工知能を活用する10の方法

[[210916]]今日、Web デザインは絶えず進化しており、トップクラスの Web デザイナーは...

何も知らない状態から、3分で「ナレッジグラフ」を素早く理解するまで

[51CTO.com からのオリジナル記事] ナレッジ グラフは、インテリジェント マシンの脳を解き...

企業が大型モデルに「参入」する場合、なぜ大手メーカーによる生産が推奨されるのでしょうか?

GPT-3.5が海外で発売されてからまだ1年も経っていないし、文心易言が国内で発売されてからまだ半...

...

新たなAIスタントがあなたの人生と私の人生への影響を加速させる

現在「ホットスポットの中のホットスポット」として、人工知能は絶大な人気を誇っています。モバイルインタ...

人工知能がメンタルヘルスの改善に役立つ4つの方法

[51CTO.com クイック翻訳] 私たちはメンタルヘルスの危機を経験しています。世界人口の約 1...