プロのアニメーターがGANを使って「怠け者」を助ければ、数週間かかる仕事を数分で終わらせられる

プロのアニメーターがGANを使って「怠け者」を助ければ、数週間かかる仕事を数分で終わらせられる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

視覚効果アーティストと GAN が力を合わせると、作成するアニメーションの見栄えは良くなるでしょうか?

答えは「はい」です。

これは、海外版TikTokで大人気の女の子、ベラ・ポーチの動画を使って、視覚効果アーティストが作成したオバマのTikTokバージョンです。

アニメーション効果がリアルで表現が鮮明なだけでなく、GAN によって生成されたキャラクターは誤って「デモデル化」されることはありません。

当時、このプロのアニメーターは AI に触れるとすぐに、アートを創り出す AI の「能力」に魅了されました。GAN を使用してビデオ内のキャラクターをアニメーション化するのにかかった時間はわずか数分でした。

一方、通常のソフトウェアを使用してアニメーションを作成する場合、アニメーターには数週間かかることもあります。

しかし、彼はすぐに、既存の AI 顔アニメーション モデルによって生成された漫画のキャラクターがあまりにも醜いことに気づきました。

下の画像のように、安倍晋三をAIでアニメ化したら、漫画のキャラクターの顔があまりよく見えなくなってしまいました…

△アニメ後、額が少し黒くなって変な感じに

そこで彼は自ら行動を起こし、既存の GAN モデルを最適化し、調整しました。

効果は抜群です!

普通の人間の顔が美化されたように見えるだけでなく、この漫画画像はディズニーアニメの主人公に匹敵します。

オバマ氏でさえ「若返り」、美容フィルターをかけるよりも若く見える。

さらに、事前に録画されたビデオからでも、誰でもこれらの漫画キャラクターの表情をコントロールできます。

では、このアニメーション効果はどのようにして実現されるのでしょうか?

転移学習の魔法

この視覚効果アーティストは、見栄えの良い漫画キャラクターを作成するために特別な方法を使用することを選択しました。

彼は転移学習を使用して 7×6 の表を生成し、転移学習の強さに基づいてさまざまなスタイルの顔を生成しました。

つまり、転移学習の強度が大きければキャラクターは漫画風に近づき、転移学習の強度が小さければキャラクターは実写に近くなります。

画像が左下隅に近いほど肖像画はより現実的であり、右上隅に近いほどキャラクターはより漫画的であることがわかります。

こうすることで、キャラクターの特徴を最大限に保持し、漫画の顔をよりリアルに見せることができます。

さらに、AIは「顧客ニーズ」に基づいてより適切なポートレートを決定し、データのトレーニングを行うことができます。

ユージン老人でさえ、かなり若く見え、「カールじいさんの空飛ぶ家」に出てくる心優しいおじいさんの面影さえ少し残しています。

その中で、視覚効果アーティストはGANを使用して漫画キャラクターの画像を生成しました。

「性別」と年齢を変更できる

このビジュアルエフェクトアーティストが使用する基本モデルは、主にDeepAIをベースにしたJustin PinkneyとDoron AdlerによるStyleGAN2 FFHQ (Nvidiaのモデル)です。

StyleGAN の原理は、入力層を廃止し、非線形マッピング ネットワークを追加することです。

さらに、スタイルベースジェネレーターと呼ばれるジェネレーターを革新し、髪型やそばかすなど、生成された画像の高度な属性を制御できるようになりました。

さらに、この StyleGAN には、さまざまな顔データセットを含むオープンソースデータセット FFHQ が付属しています。

このビジュアルエフェクトアーティストは、StyleGAN2 FFHQ を微調整しました。

GAN によって生成されたキャラクター画像は、漫画化できるだけでなく、様式化して、同様のスタイルを持つキャラクターの表情や特徴を生成することもできます。

かわいい子供を漫画化できるだけでなく、眉毛や顔の特徴に基づいて女の子の顔を構築することもできます。

キャラクターが「成長」すると、ステレオタイプの女の子の顔もより大人っぽくなります。

このソフトウェアはまだオープンソース化されていないのは、視覚効果アーティストが自分の作成したアニメーションにあまり満足しておらず、まだ改善の余地があると考えているためだと思われます。

しかし、ネットユーザーたちは少し焦っているようだ。

二次元世界を愛するネットユーザーの中には、このようなツールによってあらゆる漫画がアニメ化されるようになるのではないかと期待する声もあった。

一部のネットユーザーも、このようなツールは素晴らしいと述べ、作者が作品に満足した後、オープンソース化する意思があるかどうか疑問に思っているようだ。

このビジュアルエフェクトアーティストが目標を達成し、モデルコードをオープンソース化してくれることを願っています。

著者について

Nathan Shipley は、視覚効果アーティスト、モーション グラフィックス アーティスト、クリエイティブ テクニシャンです。彼の現在の研究対象は、AI 生成アートです。

さらに、この特殊効果アーティストは、2019年にフロリダ州セントピーターズバーグのダリ美術館でシュルレアリスムの画家サルバドール・ダリ自身を「復活」させた。

画家ダリの作品に興味がある来場者は、ボタンを押すだけで、スクリーン上でダリが生き生きとした表情で「挨拶」してくるのを見ることができます。

彼の作品に興味がある方は、下のホームページアドレスをクリックしてご覧ください。

Nathan Shipley のホームページアドレス:
http://www.nathanshipley.com/gan

<<:  完全なグラフが利用できない場合にグラフディープラーニングを使用するにはどうすればよいでしょうか?

>>:  科学者は、指示に従って芸術作品を制作する「絵画」ロボットの群れを作った

ブログ    

推薦する

...

AIの活用を拡大するには? 人工知能には「1%の問題」がある

人工知能(AI)については多くの報道や解説がなされてきました。奇跡を起こすことができると言う人もいれ...

データベース列ストレージ: 最適な圧縮アルゴリズムを設計するための近道

データベースの保存方法によって、データベース操作の効率が決まります。51CTO データベース チャネ...

画像分類の精度を段階的に向上させるにはどうすればよいでしょうか?

[[205151]] 1. 問題の説明画像認識や画像分類、その他の機械学習タスクを扱う場合、どのよ...

1.9k の星を獲得した LLM 微調整ツール Lamini は高速かつ強力で、無料で利用可能

LLM の微調整は、複雑な問題から、継続的な技術改善を通じてアクセス可能な問題へと変化しました。さて...

顔認証ロック解除を使用するとき、携帯電話はどのようにしてあなたを「認識」するのでしょうか?顔認識について詳しく知る

2020年10月1日、私たちの祖国は71歳の誕生日を迎えました!我が国は、最初の人工衛星の打ち上げか...

2017 年グローバル人工知能人材ホワイトペーパー: 世界トップクラスの AI 人材の秘密を解明!

人工知能における競争は優秀な人材に基づいて行われます。国の将来の発展方向として、AI技術は経済発展、...

3月にGithubで最も人気のあるデータサイエンスと機械学習のプロジェクト

Analytics Vidhya は最近、3 月の GitHub で上位 5 つのデータ サイエンス...

ゴリラもMinecraftをプレイできるようになり、動画を一度見るだけで新しいスキルが手に入る

GPT-4にMinecraftの遊び方を教えた後、人間はゴリラにもこのゲームの遊び方を教えました。写...

私の国はAIや5Gを含む多くの技術で米国を上回っており、米国が私たちを絞め殺すことはますます困難になっています。

世界大国として、中国と米国は多くの分野、特に科学技術分野で競争している。中国は科学技術分野で比較的目...

...

GPT-4 パラメータに関する最新の情報! 1.76兆個のパラメータ、8220億個のMoEモデル、PyTorchの創設者は確信している

皆さん、GPT-4 のパラメータは 1 兆を超える可能性があります。最近、アメリカの有名なハッカーで...

メタ研究者が新たなAIの試み:地図や訓練なしでロボットに物理的なナビゲーションを教える

Meta Platformsの人工知能部門は最近、少量のトレーニングデータのサポートにより、AIモデ...

大規模ディープラーニングツールの最新動向を詳しく見る

Panos Labropoulos 博士は、Bright Computing のシニア サポート エ...

大規模モデルを路上に展開するための重要なステップ: 世界初の言語 + 自動運転オープンソースデータセットが登場

DriveLM は、データセットとモデルで構成される言語ベースのドライブ プロジェクトです。 Dri...