Fooocus: シンプルで強力な安定した拡散 WebUI

Fooocus: シンプルで強力な安定した拡散 WebUI

Stable Diffusion は強力な画像生成 AI モデルですが、通常は多くのチューニングとヒント エンジニアリングが必要です。 Fooocus はそれを変えることを目指しています。

ControlNet 論文の著者でもある Fooocus の創設者 Lvmin Zhang 氏は、このプロジェクトを「Stable Diffusion」と「Midjourney」の設計の再構築であると説明しています。 Fooocus は Midjourney の無料オフライン版のようなものですが、SDXL モデルを使用します。言い換えれば、複雑な設定をほとんど行わずに、安定拡散描画プロセスを非常にうまく最適化します。

Fooocus には多くの最適化と品質改善が組み込まれて自動化されており、他のページでの手動設定が自動構成に変換されるため、Midjourney と同様に、あらゆる試行で良好な結果が得られます。さらに詳しい操作をしたい場合は、Fooocus の [詳細設定] タブを使用できます。シャープネスフィルターの設定や lora のカスタマイズなど。

この投稿では、FooocusをローカルとColabで使用する方法を紹介します。

Windowsで実行

ファイルをダウンロードして解凍し、run.bat を実行するだけです。とても簡単です。

初回実行時にモデルが自動的にダウンロードされます。それらのファイルがすでにある場合は、上記の場所にコピーしてインストールを高速化できます。

  • sd_xl_base_1.0_0.9vae.セーフテンソル
  • sd_xl_refiner_1.0_0.9vae.セーフテンソル

Fooocus は、16GB の RAM と 6GB の VRAM を搭載したシステムで非常に優れたパフォーマンスで実行できます。次の画像は Github からのものです。

最小要件は、4GB の Nvidia GPU メモリ (4GB VRAM) と 8GB のシステム メモリ (8GB RAM) です。

Linuxで実行

Linux ではさらに簡単です:

 git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus conda env create -f environment.yaml conda activate fooocus pip install -r requirements_versions.txt

プロセスを高速化するために Windows に似たモデルをダウンロードしますが、起動コマンドは次のようになります。

 python launch.py

または、リモートポートを開きたい場合は、listenパラメータを使用する必要があります。

 python launch.py --listen

Google Colabで実行

GPUを使用する必要があるため、ここではT4 GPUを選択します。

次に、次のコマンドを使用します。ダウンロードとインストールのため、この操作は完了するまでに時間がかかる場合がありますが、Colab はすぐにダウンロードされるため、モデルを転送する必要はありません。

 %cd /content !git clone https://github.com/lllyasviel/Fooocus !apt -y update -qq !wget https://github.com/camenduru/gperftools/releases/download/v1.0/libtcmalloc_minimal.so.4 -O /content/libtcmalloc_minimal.so.4 %env LD_PRELOAD=/content/libtcmalloc_minimal.so.4 !pip install torchsde==0.2.5 einops==0.4.1 transformers==4.30.2 safetensors==0.3.1 accelerate==0.21.0 !pip install pytorch_lightning==1.9.4 omegacnotallow==2.2.3 gradio==3.39.0 xformers==0.0.20 tritnotallow==2.0.0 pygit2==1.12.2 !apt -y install -qq aria2 !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_base_1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_base_1.0_0.9vae.safetensors !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_refiner_1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_refiner_1.0_0.9vae.safetensors !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_offset_example-lora_1.0.safetensors -d /content/Fooocus/models/loras -o sd_xl_offset_example-lora_1.0.safetensors %cd /content/Fooocus !git pull !python launch.py --share

完了すると、次のような接続が表示されます。

右側のgradio.liveリンクをクリックすると、インターフェースが表示されます。詳細設定を行う場合は、詳細オプションでより詳細な設定を確認できます。

要約する

Fooocus は AUTOMATIC1111 よりも操作がはるかに便利で、インストールも簡単です。私が生成した結果をご覧ください。

最後に、Githubのより詳しい情報はこちらをご覧ください。

https://github.com/lllyasviel/Foocus より

<<:  GPUパフォーマンスを最大化

>>:  ディープラーニングは他の画像処理アルゴリズムを置き換えることができますか?

ブログ    

推薦する

仕事と生産を再開、「新しいインフラ」が人工知能の能力を加速させる

「この突然の流行は人類にとって大きな災害だが、人工知能産業の発展にとってはまたとない新たなチャンスで...

AIは金融犯罪者と戦う技術である

犯罪の手法がより巧妙になるにつれ、マネーロンダリングとの戦いは世界中のすべての金融機関にとって大きな...

サプライチェーン管理における AI イノベーションを活用するために従業員を再教育する方法

サプライチェーン管理は最適化ゲームです。 AI の導入により、企業は最適な成果の達成にさらに注力でき...

自動運転のテストが加速:北京と上海が重要なニュースを発表

2018 年後半には、自動運転とインテリジェント コネクテッド ビークルの市場が活況を呈しました。昨...

AI、BI、データ: 2020 年までに勝利するのは誰か?

10 年前、データと分析の市場には大手企業が存在しませんでした。実際、業界では「クラウド」、「ビッ...

人工知能の時代において、結核を根絶するまでにどれくらい時間がかかるのでしょうか?

結核は古代の呼吸器感染症として人類の歴史を通じて存在し、何億人もの命を奪い、「白ペスト」として知られ...

米国が中国へのAIソフトウェア輸出制限を発表、ドローンと自動運転が最初に影響を受ける

2020年が到来。テクノロジー規制は改善されたのでしょうか? [[311882]]空想を捨てなさい。...

...

...

人工知能は中国の製造業にどのような変化をもたらすのでしょうか?

[[260379]]データマップ:中国航空宇宙科学産業集団第三科学院第35研究所が開発に成功した新...

ChatGPTコードインタープリターとJupyter Notebookを組み合わせてコーディング機能を強化

AIの助けを借りれば、開発者のコ​​ーディング効率が大幅に向上することは間違いありません。開発者は単...

スマート製造に関する新しい規制が8月に施行されます。これらは大きな影響力を持っており、知っておく必要があります

顔認識アプリケーションは司法解釈を受ける7月28日、我が国の最高人民法院は「顔認識技術を用いた個人情...