Fooocus: シンプルで強力な安定した拡散 WebUI

Fooocus: シンプルで強力な安定した拡散 WebUI

Stable Diffusion は強力な画像生成 AI モデルですが、通常は多くのチューニングとヒント エンジニアリングが必要です。 Fooocus はそれを変えることを目指しています。

ControlNet 論文の著者でもある Fooocus の創設者 Lvmin Zhang 氏は、このプロジェクトを「Stable Diffusion」と「Midjourney」の設計の再構築であると説明しています。 Fooocus は Midjourney の無料オフライン版のようなものですが、SDXL モデルを使用します。言い換えれば、複雑な設定をほとんど行わずに、安定拡散描画プロセスを非常にうまく最適化します。

Fooocus には多くの最適化と品質改善が組み込まれて自動化されており、他のページでの手動設定が自動構成に変換されるため、Midjourney と同様に、あらゆる試行で良好な結果が得られます。さらに詳しい操作をしたい場合は、Fooocus の [詳細設定] タブを使用できます。シャープネスフィルターの設定や lora のカスタマイズなど。

この投稿では、FooocusをローカルとColabで使用する方法を紹介します。

Windowsで実行

ファイルをダウンロードして解凍し、run.bat を実行するだけです。とても簡単です。

初回実行時にモデルが自動的にダウンロードされます。それらのファイルがすでにある場合は、上記の場所にコピーしてインストールを高速化できます。

  • sd_xl_base_1.0_0.9vae.セーフテンソル
  • sd_xl_refiner_1.0_0.9vae.セーフテンソル

Fooocus は、16GB の RAM と 6GB の VRAM を搭載したシステムで非常に優れたパフォーマンスで実行できます。次の画像は Github からのものです。

最小要件は、4GB の Nvidia GPU メモリ (4GB VRAM) と 8GB のシステム メモリ (8GB RAM) です。

Linuxで実行

Linux ではさらに簡単です:

 git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus conda env create -f environment.yaml conda activate fooocus pip install -r requirements_versions.txt

プロセスを高速化するために Windows に似たモデルをダウンロードしますが、起動コマンドは次のようになります。

 python launch.py

または、リモートポートを開きたい場合は、listenパラメータを使用する必要があります。

 python launch.py --listen

Google Colabで実行

GPUを使用する必要があるため、ここではT4 GPUを選択します。

次に、次のコマンドを使用します。ダウンロードとインストールのため、この操作は完了するまでに時間がかかる場合がありますが、Colab はすぐにダウンロードされるため、モデルを転送する必要はありません。

 %cd /content !git clone https://github.com/lllyasviel/Fooocus !apt -y update -qq !wget https://github.com/camenduru/gperftools/releases/download/v1.0/libtcmalloc_minimal.so.4 -O /content/libtcmalloc_minimal.so.4 %env LD_PRELOAD=/content/libtcmalloc_minimal.so.4 !pip install torchsde==0.2.5 einops==0.4.1 transformers==4.30.2 safetensors==0.3.1 accelerate==0.21.0 !pip install pytorch_lightning==1.9.4 omegacnotallow==2.2.3 gradio==3.39.0 xformers==0.0.20 tritnotallow==2.0.0 pygit2==1.12.2 !apt -y install -qq aria2 !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_base_1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_base_1.0_0.9vae.safetensors !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_refiner_1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_refiner_1.0_0.9vae.safetensors !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_offset_example-lora_1.0.safetensors -d /content/Fooocus/models/loras -o sd_xl_offset_example-lora_1.0.safetensors %cd /content/Fooocus !git pull !python launch.py --share

完了すると、次のような接続が表示されます。

右側のgradio.liveリンクをクリックすると、インターフェースが表示されます。詳細設定を行う場合は、詳細オプションでより詳細な設定を確認できます。

要約する

Fooocus は AUTOMATIC1111 よりも操作がはるかに便利で、インストールも簡単です。私が生成した結果をご覧ください。

最後に、Githubのより詳しい情報はこちらをご覧ください。

https://github.com/lllyasviel/Foocus より

<<:  GPUパフォーマンスを最大化

>>:  ディープラーニングは他の画像処理アルゴリズムを置き換えることができますか?

ブログ    
ブログ    
ブログ    

推薦する

...

Googleがこれまでで最も強力なAIモデル「Gemini」を発表

グーグルは水曜日、AIを収益化する方法に対する回答を求める圧力が高まる中、同社がこれまでで最も強力だ...

医療提供者はなぜインテリジェントオートメーションに投資する必要があるのでしょうか?

インテリジェント オートメーション (IA) は、人工知能とオートメーションを組み合わせたものです。...

...

...

Github が絶賛: モザイクテキスト = 無意味、AI があなたの思考をすべて見抜く、オープンソースに

「この写真をフォトショップで加工しましょう!」 「いいですよ、でもこの段落は検閲しないと面倒なことに...

ついに、データ、情報、アルゴリズム、統計、確率、データマイニングをわかりやすく説明してくれる人がいました!

[[282346]]データとは何かデータとは何でしょうか? これは私たちがほとんど無視する質問にな...

Ant Groupが、プログラマー向けAIアシスタントの新たな競合製品となるオープンソースコードモデルCodeFuseを発表

9月8日現在、コード作成を支援できるAI製品はすでに数多く市場に出回っている。本日の外灘大会サブフォ...

AIがエンタープライズデータカタログを救う方法

「データ カタログ」という概念は、実は新しいものではありません。メインフレームの時代から、企業はデー...

...

報告書では、人工知能の新世代について再び言及しており、3つのキーワードが完全に解釈されている。

最近、「両会」の政府活動報告では、人工知能が再び言及された。「新世代人工知能の研究開発と応用を強化し...

人工知能が伝統文化に新たな命を吹き込む。パンダ型ロボット「Youyou」が「新年クロストーク会議」に登場

「パンダはトークができる、パンダはジョークを言うことができる、パンダは書道を書ける、そしてパンダはチ...

...

機械は倫理的な判断を下せるのか?

ロボットや機械が下す決定は必ずしも道徳的に正しいとは限りません。テクノロジー企業が機械倫理に注目する...