mieki256's diary



2024/11/27(水) [n年前の日記]

#1 [cg_tools] Stable Diffusion web UI Forge でFLUX.1による画像生成を試した

Stable Diffusion web UI Forgeを使うと FLUX.1 で画像生成できるという記事を目にしたので試してみることにした。せっかくメインPCのメモリを16GBから32GBに交換したことだし…。

_ASCII.jp:話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6)

環境は以下。
ビデオカードが GTX 1060 6GB という、古い上にVRAMも全然足りてないソレなのだけど、Forge はメインメモリを使ってどうにか動かしてくれるという話も見かけたので…。

モデルデータの入手 :

以下のファイルを入手。
  • flux1-dev-bnb-nf4-v2.safetensors ... checkpointデータ。(StabilityMatrixインストールフォルダ)\Data\Models\StableDiffusion\ にコピー。11.2GBほど。
  • ae.safetensors ... VAEデータ。(StabilityMatrixインストールフォルダ)\Data\Models\VAE\ にコピー。319.8MBほど。
  • clip_l.safetensors ... (StabilityMatrixインストールフォルダ)\Data\Packages\Stable Diffusion WebUI Forge\models\text_encoder\ にコピー。234.7MBほど。
  • t5xxl_fp8_e4m3fn.safetensors ... (StabilityMatrixインストールフォルダ)\Data\Packages\Stable Diffusion WebUI Forge\models\text_encoder\ にコピー。4.6GBほど。

_lllyasviel/flux1-dev-bnb-nf4 at main
_silveroxides/flux1-nf4-weights at main
_comfyanonymous/flux_text_encoders at main

  • FLUX.1 のモデルデータは、dev と schenll のどちらかを入手できるらしい。
  • dev のほうが細かく描画できるけど処理時間が長くて、schnell のほうが荒いけど処理時間が短いらしい。
  • 描写の細かさとメモリの使用量は比例する。fp16 > fp8 > nf4 になってるらしい。
自分の環境は VRAM が圧倒的に少ないし、メインメモリもこの手のソレを動かすならおそらく最低レベルだろうから、最初から nf4 だの fp8 だのを選んだ。どうせコレ以外は選べないだろう…。たぶん。

checkpoint と VAE は、Stability Matrix が用意しているモデルデータ格納フォルダに配置すれば済むのだけど。それ以外のファイルは text_encoder/ なるフォルダに入れないといけないらしくて。でも、Stability Matrix側のフォルダの中に、そんなフォルダは無い。仕方ないので Forge をインストールしてあるフォルダの中に配置してしまうことにした。

実行 :

Stability Matrix 経由で Stable Diffusion web UI Forge を起動。Google Chrome から http://127.0.0.1:7860/ にアクセスしてUI画面を開いた。

  • UI : flux を選択。
  • Checkpoint : sd\flux1-dev-bnb-nf4-v2.safetensors を選択。
  • VAE/Text Encoder : ae.safetensors, clip_l.safetensors, t5xxl_fp8_e4m3fn.safetensors の3つを選択。
  • Diffusion in Low Bits : Automatic にしておいた。
  • Swap Method : Queue を選択。
  • Swap Location : CPU を選択。
  • GPU Weights (MB) : 5119 が入ってたのでそのまま。
  • サンプリング方法 : Euler
  • Schedule type : Simple
  • サンプリングステップ数 : 20。FLUX dev の場合は 20 で、FLUX schnell の場合は 4 にするらしい。
  • 幅 x 高さ : 896 x 1152 が入ってたのでそのまま。
  • Distilled CFG Scale : 3.5 になってたのでそのまま。
  • CFGスケール : 1。FLUX.1 はここが1で固定らしい。

結果 :

画像が生成された。VRAMが6GBしかないのに、ちゃんと画像が生成された。Forge スゴイ。スゴイぞ。

しかし、最初の画像を生成するのに40分かかった…。このスペックのPCでは、さすがにそのぐらいかかるか…。ただ、2枚目の画像生成は10分ぐらいだった。

調子に乗って(?)、flux1-schnell-bnb-nf4.safetensors を入手して配置して、そちらを選んで生成してみた。この場合、2分ぐらいで画像生成できた。ただ、プロンプトの内容があまり反映されてないような感じもする…。

それと、なんだか色合いが全般的におかしい。自分、VAE/Text Encoderの指定を間違えてないか?

とはいえ、話題の FLUX.1 をこんなヘボヘボスペックのPCで動かせたのはスゴイなと…。Forgeスゴイ。

2024/11/28追記 :

fp8 や nf4 の場合、VAE/Text Encoderが含まれてるから指定しなくてもいいと前述の記事に書いてあった。たしかに外してみても変な色にはならなかった。

以上です。

過去ログ表示

Prev - 2024/11 - Next
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

カテゴリで表示

検索機能は Namazu for hns で提供されています。(詳細指定/ヘルプ


注意: 現在使用の日記自動生成システムは Version 2.19.6 です。
公開されている日記自動生成システムは Version 2.19.5 です。

Powered by hns-2.19.6, HyperNikkiSystem Project