Fooocus: シンプルで強力な安定した拡散 WebUI

Fooocus: シンプルで強力な安定した拡散 WebUI

Stable Diffusion は強力な画像生成 AI モデルですが、通常は多くのチューニングとヒント エンジニアリングが必要です。 Fooocus はそれを変えることを目指しています。

ControlNet 論文の著者でもある Fooocus の創設者 Lvmin Zhang 氏は、このプロジェクトを「Stable Diffusion」と「Midjourney」の設計の再構築であると説明しています。 Fooocus は Midjourney の無料オフライン版のようなものですが、SDXL モデルを使用します。言い換えれば、複雑な設定をほとんど行わずに、安定拡散描画プロセスを非常にうまく最適化します。

Fooocus には多くの最適化と品質改善が組み込まれて自動化されており、他のページでの手動設定が自動構成に変換されるため、Midjourney と同様に、あらゆる試行で良好な結果が得られます。さらに詳しい操作をしたい場合は、Fooocus の [詳細設定] タブを使用できます。シャープネスフィルターの設定や lora のカスタマイズなど。

この投稿では、FooocusをローカルとColabで使用する方法を紹介します。

Windowsで実行

ファイルをダウンロードして解凍し、run.bat を実行するだけです。とても簡単です。

初回実行時にモデルが自動的にダウンロードされます。それらのファイルがすでにある場合は、上記の場所にコピーしてインストールを高速化できます。

  • sd_xl_base_1.0_0.9vae.セーフテンソル
  • sd_xl_refiner_1.0_0.9vae.セーフテンソル

Fooocus は、16GB の RAM と 6GB の VRAM を搭載したシステムで非常に優れたパフォーマンスで実行できます。次の画像は Github からのものです。

最小要件は、4GB の Nvidia GPU メモリ (4GB VRAM) と 8GB のシステム メモリ (8GB RAM) です。

Linuxで実行

Linux ではさらに簡単です:

 git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus conda env create -f environment.yaml conda activate fooocus pip install -r requirements_versions.txt

プロセスを高速化するために Windows に似たモデルをダウンロードしますが、起動コマンドは次のようになります。

 python launch.py

または、リモートポートを開きたい場合は、listenパラメータを使用する必要があります。

 python launch.py --listen

Google Colabで実行

GPUを使用する必要があるため、ここではT4 GPUを選択します。

次に、次のコマンドを使用します。ダウンロードとインストールのため、この操作は完了するまでに時間がかかる場合がありますが、Colab はすぐにダウンロードされるため、モデルを転送する必要はありません。

 %cd /content !git clone https://github.com/lllyasviel/Fooocus !apt -y update -qq !wget https://github.com/camenduru/gperftools/releases/download/v1.0/libtcmalloc_minimal.so.4 -O /content/libtcmalloc_minimal.so.4 %env LD_PRELOAD=/content/libtcmalloc_minimal.so.4 !pip install torchsde==0.2.5 einops==0.4.1 transformers==4.30.2 safetensors==0.3.1 accelerate==0.21.0 !pip install pytorch_lightning==1.9.4 omegacnotallow==2.2.3 gradio==3.39.0 xformers==0.0.20 tritnotallow==2.0.0 pygit2==1.12.2 !apt -y install -qq aria2 !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_base_1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_base_1.0_0.9vae.safetensors !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_refiner_1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_refiner_1.0_0.9vae.safetensors !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_offset_example-lora_1.0.safetensors -d /content/Fooocus/models/loras -o sd_xl_offset_example-lora_1.0.safetensors %cd /content/Fooocus !git pull !python launch.py --share

完了すると、次のような接続が表示されます。

右側のgradio.liveリンクをクリックすると、インターフェースが表示されます。詳細設定を行う場合は、詳細オプションでより詳細な設定を確認できます。

要約する

Fooocus は AUTOMATIC1111 よりも操作がはるかに便利で、インストールも簡単です。私が生成した結果をご覧ください。

最後に、Githubのより詳しい情報はこちらをご覧ください。

https://github.com/lllyasviel/Foocus より

<<:  GPUパフォーマンスを最大化

>>:  ディープラーニングは他の画像処理アルゴリズムを置き換えることができますか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

このアリは写真を撮ることができます!プリンストン大学は、50万分の1の大きさに縮小されたミクロンレベルのカメラを開発した。

最近、プリンストン大学の研究者らは、世界初の高品質ミクロンスケール光学イメージングデバイス「ニューラ...

EU諸国の4分の1がAIによるサイバーセキュリティ管理を望んでいる

予想外かもしれませんが、消費者のかなりの部分は、サイバーセキュリティを生身のサイバーセキュリティ専門...

オープンソースAIとプロプライエタリAIの戦い

IBM と Meta のパートナーおよび協力者には、AMD、Intel、NASA、CERN、Hugg...

AI生成画像に追加されたデジタル透かしは簡単に解読できると研究で判明

10月6日、EngadgetやWiredなどの海外メディアの報道によると、メリーランド大学の研究チー...

メモリを3%~7%削減! Google がコンパイラ最適化のための機械学習フレームワーク MLGO を提案

現代のコンピュータの出現により、より高速でより小さなコードをコンパイルする方法が問題になりました。コ...

...

高所から物が投げ出される悲劇が多発。AI監視システム「私があなたを守ります」

近年、高所から物が投げられたり落下したりして負傷する事故が多発しています。水のボトル、スイカの皮、缶...

...

自動運転シミュレーションの雄大な景色!自動運転シミュレーションの分野についてお話ししましょう!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ニューラルネットワークの問題を解決するための新しいアイデア: OpenAI は線形ネットワークを使用して非線形問題を計算します

[[205570]]深層線形ネットワーク (浮動小数点演算を使用して実装) は実際には線形ではなく、...

知っておくべき人工知能アルゴリズム トップ 10

人工知能 (AI) 技術の人気が高まるにつれ、さまざまなアルゴリズムがこの分野の発展を促進する上で重...

...

AIOpsを始める前に知っておくべきこと

AIOps は、その優れたパフォーマンスにより、業界で幅広い注目と支持を集めています。AIOps が...