Fooocus: シンプルで強力な安定した拡散 WebUI

Fooocus: シンプルで強力な安定した拡散 WebUI

Stable Diffusion は強力な画像生成 AI モデルですが、通常は多くのチューニングとヒント エンジニアリングが必要です。 Fooocus はそれを変えることを目指しています。

ControlNet 論文の著者でもある Fooocus の創設者 Lvmin Zhang 氏は、このプロジェクトを「Stable Diffusion」と「Midjourney」の設計の再構築であると説明しています。 Fooocus は Midjourney の無料オフライン版のようなものですが、SDXL モデルを使用します。言い換えれば、複雑な設定をほとんど行わずに、安定拡散描画プロセスを非常にうまく最適化します。

Fooocus には多くの最適化と品質改善が組み込まれて自動化されており、他のページでの手動設定が自動構成に変換されるため、Midjourney と同様に、あらゆる試行で良好な結果が得られます。さらに詳しい操作をしたい場合は、Fooocus の [詳細設定] タブを使用できます。シャープネスフィルターの設定や lora のカスタマイズなど。

この投稿では、FooocusをローカルとColabで使用する方法を紹介します。

Windowsで実行

ファイルをダウンロードして解凍し、run.bat を実行するだけです。とても簡単です。

初回実行時にモデルが自動的にダウンロードされます。それらのファイルがすでにある場合は、上記の場所にコピーしてインストールを高速化できます。

  • sd_xl_base_1.0_0.9vae.セーフテンソル
  • sd_xl_refiner_1.0_0.9vae.セーフテンソル

Fooocus は、16GB の RAM と 6GB の VRAM を搭載したシステムで非常に優れたパフォーマンスで実行できます。次の画像は Github からのものです。

最小要件は、4GB の Nvidia GPU メモリ (4GB VRAM) と 8GB のシステム メモリ (8GB RAM) です。

Linuxで実行

Linux ではさらに簡単です:

 git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus conda env create -f environment.yaml conda activate fooocus pip install -r requirements_versions.txt

プロセスを高速化するために Windows に似たモデルをダウンロードしますが、起動コマンドは次のようになります。

 python launch.py

または、リモートポートを開きたい場合は、listenパラメータを使用する必要があります。

 python launch.py --listen

Google Colabで実行

GPUを使用する必要があるため、ここではT4 GPUを選択します。

次に、次のコマンドを使用します。ダウンロードとインストールのため、この操作は完了するまでに時間がかかる場合がありますが、Colab はすぐにダウンロードされるため、モデルを転送する必要はありません。

 %cd /content !git clone https://github.com/lllyasviel/Fooocus !apt -y update -qq !wget https://github.com/camenduru/gperftools/releases/download/v1.0/libtcmalloc_minimal.so.4 -O /content/libtcmalloc_minimal.so.4 %env LD_PRELOAD=/content/libtcmalloc_minimal.so.4 !pip install torchsde==0.2.5 einops==0.4.1 transformers==4.30.2 safetensors==0.3.1 accelerate==0.21.0 !pip install pytorch_lightning==1.9.4 omegacnotallow==2.2.3 gradio==3.39.0 xformers==0.0.20 tritnotallow==2.0.0 pygit2==1.12.2 !apt -y install -qq aria2 !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_base_1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_base_1.0_0.9vae.safetensors !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_refiner_1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_refiner_1.0_0.9vae.safetensors !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_offset_example-lora_1.0.safetensors -d /content/Fooocus/models/loras -o sd_xl_offset_example-lora_1.0.safetensors %cd /content/Fooocus !git pull !python launch.py --share

完了すると、次のような接続が表示されます。

右側のgradio.liveリンクをクリックすると、インターフェースが表示されます。詳細設定を行う場合は、詳細オプションでより詳細な設定を確認できます。

要約する

Fooocus は AUTOMATIC1111 よりも操作がはるかに便利で、インストールも簡単です。私が生成した結果をご覧ください。

最後に、Githubのより詳しい情報はこちらをご覧ください。

https://github.com/lllyasviel/Foocus より

<<:  GPUパフォーマンスを最大化

>>:  ディープラーニングは他の画像処理アルゴリズムを置き換えることができますか?

ブログ    

推薦する

UdeskブランドアップグレードWofeng TechnologyはAIコア技術を深化させ、5つの主要製品ラインでトップ1または2戦略を全面的に推進

6月9日、「新AI、新企業サービス、新旅」Wofeng Technologyブランドアップグレードメ...

...

人工知能が仕事を奪っていますが、将来の職場で私たちは何のために戦うのでしょうか?

病院では、人工知能 (AI) は人間の医師よりもレントゲンの分析が得意です。法律事務所では、AI は...

無料ですか?寄生? ChatGPTに夢中です!

51CTOウェブサイトコンテンツ調査に参加するにはクリックしてくださいマット・アセイ編纂者:Qia...

...

5G、人工知能、音声技術…2020年に注目すべき6つのテクノロジートレンド

あらゆるもののインターネット化への道のりにおいて、自動化、5G、人工知能、音声技術、ブロックチェーン...

ロビン・リーは、最後の自慢を達成した後、今日の百度世界大会でさらに 3 つの目標を設定しました。

[[248365]] 7月4日に開催された百度AI開発者会議で、ロビン・リー氏は「以前自慢していた...

...

...

...

ハイパーオートメーションの旅を始めましょう: 仕事のやり方を変え、運用プロセスを簡素化しましょう

最近の調査によると、より複雑な作業をインテリジェントな自動化に任せることを計画している企業の数は、今...

初級データベースアルゴリズム [I]

作者は長い間ブログを更新していませんでした。その理由の一つは、開発したプロジェクトで使用されている技...

...

Meta-Transformer: マルチモーダル学習のための統一フレームワーク

Meta-Transformer は、自然言語、画像、ポイント クラウド、オーディオ、ビデオ、時系列...

ナレッジグラフは銀行のビジネスモデルをどのように変えるのでしょうか?

金融部門は、個人の購入から大規模な取引まで、莫大な富につながる大量の貴重なデータを定期的に生成してお...