プロのアニメーターがGANを使って「怠け者」を助ければ、数週間かかる仕事を数分で終わらせられる

プロのアニメーターがGANを使って「怠け者」を助ければ、数週間かかる仕事を数分で終わらせられる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

視覚効果アーティストと GAN が力を合わせると、作成するアニメーションの見栄えは良くなるでしょうか?

答えは「はい」です。

これは、海外版TikTokで大人気の女の子、ベラ・ポーチの動画を使って、視覚効果アーティストが作成したオバマのTikTokバージョンです。

アニメーション効果がリアルで表現が鮮明なだけでなく、GAN によって生成されたキャラクターは誤って「デモデル化」されることはありません。

当時、このプロのアニメーターは AI に触れるとすぐに、アートを創り出す AI の「能力」に魅了されました。GAN を使用してビデオ内のキャラクターをアニメーション化するのにかかった時間はわずか数分でした。

一方、通常のソフトウェアを使用してアニメーションを作成する場合、アニメーターには数週間かかることもあります。

しかし、彼はすぐに、既存の AI 顔アニメーション モデルによって生成された漫画のキャラクターがあまりにも醜いことに気づきました。

下の画像のように、安倍晋三をAIでアニメ化したら、漫画のキャラクターの顔があまりよく見えなくなってしまいました…

△アニメ後、額が少し黒くなって変な感じに

そこで彼は自ら行動を起こし、既存の GAN モデルを最適化し、調整しました。

効果は抜群です!

普通の人間の顔が美化されたように見えるだけでなく、この漫画画像はディズニーアニメの主人公に匹敵します。

オバマ氏でさえ「若返り」、美容フィルターをかけるよりも若く見える。

さらに、事前に録画されたビデオからでも、誰でもこれらの漫画キャラクターの表情をコントロールできます。

では、このアニメーション効果はどのようにして実現されるのでしょうか?

転移学習の魔法

この視覚効果アーティストは、見栄えの良い漫画キャラクターを作成するために特別な方法を使用することを選択しました。

彼は転移学習を使用して 7×6 の表を生成し、転移学習の強さに基づいてさまざまなスタイルの顔を生成しました。

つまり、転移学習の強度が大きければキャラクターは漫画風に近づき、転移学習の強度が小さければキャラクターは実写に近くなります。

画像が左下隅に近いほど肖像画はより現実的であり、右上隅に近いほどキャラクターはより漫画的であることがわかります。

こうすることで、キャラクターの特徴を最大限に保持し、漫画の顔をよりリアルに見せることができます。

さらに、AIは「顧客ニーズ」に基づいてより適切なポートレートを決定し、データのトレーニングを行うことができます。

ユージン老人でさえ、かなり若く見え、「カールじいさんの空飛ぶ家」に出てくる心優しいおじいさんの面影さえ少し残しています。

その中で、視覚効果アーティストはGANを使用して漫画キャラクターの画像を生成しました。

「性別」と年齢を変更できる

このビジュアルエフェクトアーティストが使用する基本モデルは、主にDeepAIをベースにしたJustin PinkneyとDoron AdlerによるStyleGAN2 FFHQ (Nvidiaのモデル)です。

StyleGAN の原理は、入力層を廃止し、非線形マッピング ネットワークを追加することです。

さらに、スタイルベースジェネレーターと呼ばれるジェネレーターを革新し、髪型やそばかすなど、生成された画像の高度な属性を制御できるようになりました。

さらに、この StyleGAN には、さまざまな顔データセットを含むオープンソースデータセット FFHQ が付属しています。

このビジュアルエフェクトアーティストは、StyleGAN2 FFHQ を微調整しました。

GAN によって生成されたキャラクター画像は、漫画化できるだけでなく、様式化して、同様のスタイルを持つキャラクターの表情や特徴を生成することもできます。

かわいい子供を漫画化できるだけでなく、眉毛や顔の特徴に基づいて女の子の顔を構築することもできます。

キャラクターが「成長」すると、ステレオタイプの女の子の顔もより大人っぽくなります。

このソフトウェアはまだオープンソース化されていないのは、視覚効果アーティストが自分の作成したアニメーションにあまり満足しておらず、まだ改善の余地があると考えているためだと思われます。

しかし、ネットユーザーたちは少し焦っているようだ。

二次元世界を愛するネットユーザーの中には、このようなツールによってあらゆる漫画がアニメ化されるようになるのではないかと期待する声もあった。

一部のネットユーザーも、このようなツールは素晴らしいと述べ、作者が作品に満足した後、オープンソース化する意思があるかどうか疑問に思っているようだ。

このビジュアルエフェクトアーティストが目標を達成し、モデルコードをオープンソース化してくれることを願っています。

著者について

Nathan Shipley は、視覚効果アーティスト、モーション グラフィックス アーティスト、クリエイティブ テクニシャンです。彼の現在の研究対象は、AI 生成アートです。

さらに、この特殊効果アーティストは、2019年にフロリダ州セントピーターズバーグのダリ美術館でシュルレアリスムの画家サルバドール・ダリ自身を「復活」させた。

画家ダリの作品に興味がある来場者は、ボタンを押すだけで、スクリーン上でダリが生き生きとした表情で「挨拶」してくるのを見ることができます。

彼の作品に興味がある方は、下のホームページアドレスをクリックしてご覧ください。

Nathan Shipley のホームページアドレス:
http://www.nathanshipley.com/gan

<<:  完全なグラフが利用できない場合にグラフディープラーニングを使用するにはどうすればよいでしょうか?

>>:  科学者は、指示に従って芸術作品を制作する「絵画」ロボットの群れを作った

ブログ    

推薦する

TiDB v5.1 体験: TiDB で機械学習モデルをトレーニングしました

序文ご存知のとおり、TiDB バージョン 5.1 では多くの新機能が追加されましたが、その 1 つが...

...

1日で13.5%も急落!オラクル株は2002年以来最大の下落

オラクルの株価は現地時間9月12日に13.5%急落し、20年以上で最大の下落を記録した。その理由は、...

ディープラーニングのためのヘテロジニアス アクセラレーション テクノロジー (パート 2): カタツムリの殻の中に道場を構築する

1. 概要記事「ディープラーニング向けヘテロジニアスアクセラレーションテクノロジー(パート1)」で説...

2ポインタアルゴリズムを学んでLeetCodeをプレイする

[[421659]]みなさんこんにちは。私は梁唐です。今日は、非常に古典的で非常にシンプルなアルゴリ...

Microsoft が Meta との AI および PyTorch の連携を強化

Microsoft は、Meta との AI パートナーシップをさらに拡大し、Meta が AI ...

...

人工知能の時代、3つの問題が未来を決定づける

学習と進化ご存知のとおり、量子という概念は120年前にドイツの物理学者プランクによって提唱されました...

機械に漢字の一画一画の謎を理解させるにはどうすればいいでしょうか?

[[227335]]背景インテリジェントな顧客サービスから機械翻訳、テキスト要約の生成からユーザー...

スマートオフィス管理におけるAIの役割

スマート オフィスの概念は新しいものではありませんが、企業のオーナーや管理者が自動化の生産性の価値を...

...

OpenAI の COO が ChatGPT のリリース、開発者デー、そして Altman の考えについて語る

「アルトマン氏をご存知なら、彼は話題を素早く切り替えるのが好きなので、私たちが一つの話題に多くの時間...

清華大学は、大規模な事前トレーニングなしで効率的なNLP学習フレームワークTLMを提案

[[435029]]最近、清華大学の研究者たちは、シンプルで効率的な NLP 学習フレームワークを提...

ニューラル ネットワークが適切に機能するには、なぜ十分なパラメータが必要なのでしょうか?

従来、パラメータの数が満たすべき方程式の数より多い場合は常に、パラメータ化されたモデルを使用してデー...

人工知能は研究をどのように変えているのでしょうか?

人工知能 (AI) は研究プロセスにおいてますます重要な役割を果たしています。 AI ベースのアルゴ...