漫画は爆発的な効果でAIに変身し、サーバーが何度も圧倒された

漫画は爆発的な効果でAIに変身し、サーバーが何度も圧倒された

[[436077]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

1,241人が列に並び、2,600秒待ちました...」

——ネットユーザーは、アニメで自分がどのように見えるかを知るために本当に一生懸命努力しています!

「The Originator」は肖像画を漫画に変換できるジェネレーターです。

たった一枚の写真や動画で、老若男女、有名人やアマチュアを問わず、誰もが自分だけの「アニメスタイル」を見ることができます~

「国民の妻」王冰冰とは:

「国民の妹」 IUとは:

テクノロジー界の大物、EDGのメンバー、金髪美女、ロンママ…

髪の毛や眉毛、目に宿る感情までもが鮮やかに「描かれて」います…

△ ビデオエフェクト

ネットユーザーがサーバーを圧倒したのも不思議ではない。

皆さんの作品をパラパラとめくるだけでも、終わりがないほど奥が深い作品ばかりです。

GitHub 上の関連プロジェクトを見ると、確かにトレンドリストのトップにありました。

このAnimeGANは本当にすごいです!

アニメのような顔を作るにはどうすればいいですか?

表示されたエフェクトを確認した後、あなたも自分の漫画の顔を作成してみませんか?

これは可能です。今からステップごとにお教えします。

最初の方法は非常に簡単です。写真をアップロードするだけです。

オンラインゲームプレイを提供するウェブサイト(記事末尾のリンクを参照)は有名なHugging Faceです。

特別にオンライン AnimeGANv2 アプリがオープンし、そこに写真を「投げ込む」だけで済みます。

しかし! ! !

先ほども述べたように、AI は現在非常に普及しており、単純なオンライン方式はキューイングと同等です。

ほら、 5259秒待った後でも、まだ15人が先にいるよ...

列に並びたくない場合はどうすればいいですか?

次に、2 番目の方法であるcodeを使用します。

3時間待った後、熱心なネットユーザーはついに我慢できなくなり、 Colabバージョンを強く推奨しました(記事の最後にあるリンクを参照)。

まずドキュメント内の最初の 2 つのコード スニペットを実行し、次に写真のパスを変更します。

もちろん、チャレンジの難易度を上げたい場合は、AnimeGANv2 の GitHub プロジェクトもあります。

上記の方法はすべて画像変換に基づいています。ビデオを使用する場合は、AnimeGANv2 プロジェクトで次の 2 つのコマンドを実行します。

もちろん、このプロジェクトの Pytorch 実装もありますが、 Pytorch バージョンは現在画像変換のみをサポートしています。ビデオを変換したい場合は、当面は自分でスクリプトを作成する必要があります。

スタイル転送 + GAN

では、この効果の原理は何でしょうか?

AnimeGAN は、ニューラル スタイル転送と生成的敵対ネットワーク (GAN) の組み合わせを使用する、武漢大学と湖北理工大学の研究です。

これは実際にはCartoonGANをベースにした改良版であり、より軽量なジェネレーターアーキテクチャを提案しています。

AnimeGAN のジェネレーターは、標準畳み込み、深さ方向に分離可能な畳み込み、逆残差ブロック、アップサンプリング、およびダウンサンプリング モジュールで構成される対称エンコーダー/デコーダー ネットワークとして考えることができます。

ジェネレーターのパラメータ数を効果的に削減するために、AnimeGAN ネットワークでは 8 つの連続した同一の IRB (反転残差ブロック) が使用されます。

ジェネレーターでは、1×1 カーネルを持つ最後の畳み込み層は正規化層を使用せず、その後に tanh 非線形活性化関数が続きます。

上図で、K はカーネルサイズ、C は特徴マップの数、S は各畳み込み層の範囲、H は特徴マップの高さ、W は特徴マップの幅、Resize 値は特徴マップサイズの補間方法を設定するために使用されます。⊕ は要素ごとの追加を表します。

この V2 バージョンは AnimeGAN の第 1 世代に基づくアップグレードであり、主にモデルによって生成された画像の高周波アーティファクトの問題を解決します。

具体的には、生成された画像にネットワークが高周波アーティファクトを生成するのを防ぐために、特徴のレイヤー正規化を使用するという対策が取られます。

著者は、レイヤー正規化により、特徴マップ内の異なるチャネルに同じ特徴属性分布を持たせることができ、局所的なノイズの発生を効果的に防ぐことができると考えています。

AnimeGANv2 のジェネレータパラメータのサイズは 8.6MB ですが、AnimeGAN の場合は 15.8MB です。

2 つで使用される識別器はほぼ同じですが、違いは AnimeGANv2 がインスタンス正規化ではなくレイヤー正規化を使用することです。

ネットユーザー:私はより美しくなった

このAIは多くのファンを魅了しました。

一部のネットユーザーが「二次元に突入」した後、その驚くべき美しさを発見した。

私を美しくしてくれます!

そして彼は誇らしげに漫画の顔を披露しました。

ビル・ゲイツの影響を見て、一部のネットユーザーは次のように叫んだ。

空!ゲイツはスマートでセクシーに見えます。

著者: より優れた生成効果を備えた AnimeGANv3 が近日登場予定

AnimeGANのオリジナル作者は、湖北理工大学のLiu Gang准教授とChen Jie博士、そして彼らの学生Xin Chenの3人です。

このプロジェクトの誕生は、主にチームメンバーの個人的な興味、つまり二次元オタク文化と芸術への愛情によるものです。

著者の一人であるChen氏によると、AnimeGANとAnimeGANv2はそれぞれ完成までに2〜3か月かかり、その過程で多くの困難に遭遇したという。

これには、ハードウェア リソースの極端な不足も含まれていました。たとえば、AnimeGAN に使用された NVIDIA シングル カード サーバーは、同校の芸術デザイン学部の学部長である Rao Jian 教授によって提供されたものであり、同教授が担当する研究でも、実験を実行するために他の学生からマシンを借りることに依存していました。

AnimeGANv2 の時点では、シングル カード 2080ti サーバーは 1 つしかありませんでした。

しかし、すべての努力が無駄になったわけではありません。現在、AnimeGAN は多くの注目を集め、多くの人に好かれており、Chen 氏と彼のメンター チームは大きな達成感を感じています。

ご存知、新海誠監督もAnimeGANの作品をリポストしています。

しかし、この興味主導の科学研究プロジェクトは単なる楽しみのためではありません。

チームとの会話の中で、彼らはこう言いました。

主な目標は、学術論文をマイルストーンとして使用することであり、最大の期待は、プロジェクトが設計され、実際のアプリケーションで実装できることです。

そして次はAnimeGANv3が間もなく登場します

次に、ネットワーク サイズをより小さくし、おそらく 4M 程度にまで縮小します。同時に、AnimeGANv2 のいくつかの欠点 (たとえば、v2 では元の画像の詳細が保持されすぎている) を解決し、生成されるアニメーション効果の品質を高めます。

これは、AnimeGANv3 が商業的に実行可能であることも意味します。

AnimeGANv3が完成した後も、人間の顔をアニメーションに変換するためのアルゴリズムの最適化を継続していく予定です。

もう一つ

最後に、始める前に、AnimeGAN によって示される効果は比較的良好であるものの、大きな前提があることに注意する必要があります。

写真は高解像度で、顔の特徴が可能な限り鮮明である必要があります。

そうしないと画風がおかしくなるかもしれない(作者が実際に試してみたところ、泣きそうになったが涙は出なかった)...

それで、漫画の中であなたはどんな感じですか?

今すぐ試してみて〜

オンラインデモ:

https://huggingface.co/spaces/akhaliq/AnimeGANv2

Colabバージョン:

https://colab.research.google.com/drive/1jCqcKekdtKzW7cxiw_bjbbfLsPh-dEds?usp=sharing#scrollTo=niSP_i7FVC3c

GitHub アドレス:

https://github.com/TachibanaYoshino/AnimeGANv2

https://github.com/bryandlee/animegan2-pytorch

<<:  画像はさまざまな方法で変更できます。NVIDIAはGANを使用して高精度のディテールレタッチを実現

>>:  また一人の科学者が学界に復帰、AI産業の発展は冷え込みつつあるのか?

ブログ    
ブログ    

推薦する

...

アメリカのショッピングプラットフォームStitch Fixの王建強氏:データ主導の意思決定サポートと製品インテリジェンス

[51CTO.comより] 最近、51CTOが主催するWOTAグローバルアーキテクチャと運用技術サミ...

MITの新世代の昆虫型ドローンは、転がったり、ジャンプしたり、群れをなして飛んだりすることができ、人間の衝撃にも耐えられる。

バイオニック鳥類や昆虫はドローン研究の分野で常に重要なテーマであり、スタンフォード大学の学者が作った...

エッジ AI は興味深い未来を提供し​​ます!

人工知能(AI)は、私たちの生活のほぼすべての側面において一般的な要素になりつつあります。これまで、...

データ、AI、クラウドを活用してビル運営を変革する方法

CISO、CSO、およびそのチームは毎日、侵害を検出し、リスクを評価し、適切に対応するという課題に直...

猫=チューリングマシン? 4つのテストにより、「猫コンピューター」が任意の計算を実行できることが証明された

柔らかくてかわいい猫は、いつも私たちに「猫を撫でたい」「猫を抱きしめたい」という衝動を掻き立てます。...

無料の機械学習ベンチマークツール:主要なデータセットを統合し、GitHubに接続して使用する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

データセンターの未来: AIの力を活用して経済成長とイノベーションを推進

人気のSF小説で「機械知能の台頭」が描かれる場合、通常はレーザーや爆発が伴い、軽度な場合には軽い哲学...

2021 年のテクノロジートレンドはどこに向かうのでしょうか? IEEEが答えを教えます

[[357414]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

Facebook、AIが著作権侵害を正確に識別できるようにソースデータ拡張ライブラリを公開: 100以上の拡張方法が提供される

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

Python での機械学習 K-means アルゴリズムの実装

K平均法アルゴリズムの紹介K-means は、機械学習でよく使用されるアルゴリズムです。これは教師な...

世界をより高いレベルのイノベーションへと導く AI テクノロジー トップ 10

Analytics Insight は、世界を次のレベルのイノベーションに押し上げるトップ 10 ...

2021年の10のAIトレンド

IDCは2019年9月の時点で、2023年までに人工知能技術への支出が3倍以上の979億ドルに達する...

Google は、MLM 損失で直接事前トレーニングされた 24 個の小さな BERT モデルをリリースしました。

[[318598]] Google は最近、24 個の合理化された BERT モデルをダウンロード...