AIが別のAIに命令する、GAN+CLIPの組み合わせで「CGアーティスト」に

AIが別のAIに命令する、GAN+CLIPの組み合わせで「CGアーティスト」に

[[407645]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

GAN によって生成された画像は十分クールだと思いませんか?

データセットを変更する必要はありません。CLIP に与えるコマンドに「 Unreal Engine 」という文字を追加し、CLIP に GAN にコマンドを実行させるだけで、画像がすぐにハイエンドの CG アート スタイルになります。

テキストにUnreal Engineを追加する手法は、Aran Komatsuzaki氏がTwitterで最初に投稿し、CV界隈で多くの注目を集めました。

その後、誰かがこのプロセスをColabに投稿したところ、ネットユーザーは大騒ぎになりました。

「色鉛筆スタイル」も指定できます

あるいは「ジブリスタイル」:

最も驚くべきことは、「3D写真修復」を追加することで、実際に3次元の構成を生成できることです。

CLIP は OpenAI によって開発された、画像の並べ替えを行うモデルです。GAN と連携する方法も非常にシンプルです。

次のように、単純なランダム パターンをシードとして開始します。

このように、CLIP はテキストの説明との類似度スコアを計算し、それを GAN にフィードバックすることで、GAN はスコアの向上を目的として継続的に反復処理を行うことができます。

こうしてAIアーティスト集団が誕生したのです。

プロンプトにスタイル要件を追加するだけでなく、AI に人の名前を直接伝えて、AI の目にその人がどのように見えるかを確認することもできます。

これは、ビットコインの謎の父、サトシ・ナカモトのような、これまで一度も姿を現したことのない大物たちを推測するのにも使えます。

[[407650]]

これは AI の頭の中の Satoshi Nakamoto です。あなたが信じるかどうかは別として、私はとにかく信じます。

オンライントライアル

Colab には VQGAN+CLIP の多くのバージョンがあります。比較した結果、速度と品質の点でより優れた、追加の最適化とプーリング技術を追加したものを選択しました (記事の最後にリンクがあります)。

手順 1 と 2 を順番に実行してください。

ステップ 3 : 使用するモデルを選択します。デフォルトでは、ImageNet でトレーニングされています。

ステップ 4ではパラメータを設定します。通常は、生成するコンテンツを「|」で区切ったテキスト形式で入力するだけです。

高さは生成される画像の解像度を制御し、モデルは使用するモデルを選択できます (手順 3 でダウンロードする必要があります)。

シード番号を変更すると、ランダム画像シードが変更されます。

init_imageで初期イメージを指定することもできます。Colab 環境にイメージをアップロードしてから、リンクを入力する必要があります。

例えば、ある人はそのような画像をイメージシードとして使用し、ポケモンを生成するという新しい遊び方を考案しました。

5 番目のステップが実行され、300 x 300 解像度のグラフを 500 回繰り返すのに数分しかかかりません。

最後に、生成されたプロセスをビデオに合成できます。

とても簡単です。ぜひお試しください。

オンライントライアル:
https://colab.research.google.com/drive/1ZAus_gn2RhTZWzOWUpPERNC0Q8OhZRTZ

VQGAN:
https://github.com/CompVis/taming-transformers

クリップ:
https://openai.com/blog/clip/

<<:  MITとマイクロソフトはAI向けにLeetCodeプログラミング問題集をカスタマイズした

>>:  毛沢東選集と魯迅全集をAIに与えたところ、AIが書いた大学入試のエッセイは非常に適切だった。

ブログ    

推薦する

構築は簡単だが、維持は難しい! Googleの機械学習システムの苦い教訓

[[279958]] 2014年、機械学習の背後に隠れた高い技術的負債を調査したGoogleの論文が...

スマートビルディングにおけるエッジAIの役割を解明

仕事や住居のための物理的な空間として機能することから、入居者に活気ある建築体験を提供することまで、近...

機械学習におけるラベル漏洩とそれがモデルのパフォーマンスに与える影響について紹介します

優れた、またはほぼ優れたモデルのパフォーマンスに圧倒されていますか? あなたの幸せは裏切られています...

人工知能は裁判所によって特許発明者とみなされるでしょうか?

人工知能(AI)は、新薬の発見から新しい数学の問題の解決まで、あらゆることを人間が行うのに役立ってお...

インドの農業変革における人工知能の役割

農業はインドの人口の約58%の生計を支えています。漁業、林業、農業の総付加価値は2020年度で194...

顔の特徴を検出するシンプルなディープラーニング手法を教えます

著者注: 携帯電話で、人の顔に特殊効果を加えるアプリを見たことがあるかもしれません。これらのアプリは...

顔認識が「トレンド」になったら、少なくとも私たちには選択する権利があるはずです。

【CNMO】「東莞でトイレットペーパーを買うのに顔認証が必要」「94歳の男性が顔認証で逮捕」「南寧...

AIによるIoT革命:なぜ両者が完璧に適合するのか

モノのインターネットは、私たちの生活様式を変えるのと同様に、学習方法も変えています。 AI の専門家...

新しいプログラミングパラダイム: Spring Boot と OpenAI の出会い

2023年にはAI技術が話題となり、プログラミングを中心に多くの分野に影響を及ぼします。 Sprin...

AI技術の7つの主要トレンド

[[323768]]トレンド1: 自律型デバイス自動車、ロボット、農業など、自律型デバイスは従来人間...

コンピュータビジョンディープラーニングにおける8つのよくあるバグ

コンピューター ビジョンのディープラーニングでよくある 8 つのバグをまとめました。誰もが多かれ少な...

機械学習を学ぶ際に早い段階で知っておくべき3つのこと

私は長年、学界と産業界の両方で機械学習モデリングに取り組んできましたが、Scalable ML で「...

AIの大覚醒:チューリング賞受賞者のベンジオ氏は、AIは意識を持ち、将来の機械学習の核となるのは注意メカニズムであると語る

人工知能は意識を発達させることができるか?これはアメリカのテレビシリーズ「ウエストワールド」で取り上...

2020年のIoTイベントトップ10を振り返る。アプリケーションの加速

今日では、それはもはや高尚な概念ではありません。スマートカーやスマートホームから、企業の資産管理機器...

人工知能とデザインの未来

人工知能はあらゆる業界に混乱をもたらしています。医療分野では、AI 技術が病気の診断において人間を上...