2023/12/17(日) [n年前の日記]
#1 [cg_tools] Stable Diffusion web UIを触ってる
Stable Diffusion web UI を使って、年賀状用の画像として龍の画像を生成できないものかなとプロンプトをアレコレ試しているところ。モデルデータは lyriel_v16.safetensors。Deliberateをベースにしたモデルデータなので、汎用性があるらしい。
lyriel モデルデータなら LCM LoRA がそれらしく効いてくれて、GeForec GTX 1060 6GB という、今となっては非力なGPUでも、1枚を10秒ぐらいで生成してくれるので、なんだかんだで300枚以上は生成できたのだけど、どれも何かこう…。入れてほしいものが入ってなかったり、入れなくてもいいものが入っていたりで…。
富士山も入れたいのだけど、何故か2つ以上富士山が出てくるのだよな…。LCM LoRA を使っているせいか、プロンプトの内容に忠実な画像が出てこない感じもあって…。
lyriel モデルデータなら LCM LoRA がそれらしく効いてくれて、GeForec GTX 1060 6GB という、今となっては非力なGPUでも、1枚を10秒ぐらいで生成してくれるので、なんだかんだで300枚以上は生成できたのだけど、どれも何かこう…。入れてほしいものが入ってなかったり、入れなくてもいいものが入っていたりで…。
富士山も入れたいのだけど、何故か2つ以上富士山が出てくるのだよな…。LCM LoRA を使っているせいか、プロンプトの内容に忠実な画像が出てこない感じもあって…。
◎ Bing Image Createrも試用してみた :
Microsoft Bing Image Creater でも画像生成を試してみたけれど、こちらのほうがちゃんとした画像を ―― 何をもって「ちゃんとしてる」と判断すればいいのか分からんけど、比較的こちらの意図を汲んでくれた画像を生成してくれる、ような気がした。Bing Image Creater は DALL-E 3 を使ってるらしいけど、DALL-E 3 って凄いんだな…。
Stable Diffusion web UI はプロンプトに英語しか入力できないけれど、Bing Image Creater は日本語を入力してもそれらしい画像が生成されるので、その点もありがたい。まあ、一旦英語に自動翻訳してから渡してるのかなと想像もするのだけど。
もっとも、例えば「爆発」みたいな単語を入れると生成を拒否されたりする…。おそらくはフェイク画像の類を生成しにくいように色々なNGワードが設定されてるのだろうなと。どんなプロンプトを入れても処理してくれるわけではないので、そういう不自由さはある…。その代わり、結構イイ感じの画像を生成してくれる印象。
Stable Diffusion web UI はプロンプトに英語しか入力できないけれど、Bing Image Creater は日本語を入力してもそれらしい画像が生成されるので、その点もありがたい。まあ、一旦英語に自動翻訳してから渡してるのかなと想像もするのだけど。
もっとも、例えば「爆発」みたいな単語を入れると生成を拒否されたりする…。おそらくはフェイク画像の類を生成しにくいように色々なNGワードが設定されてるのだろうなと。どんなプロンプトを入れても処理してくれるわけではないので、そういう不自由さはある…。その代わり、結構イイ感じの画像を生成してくれる印象。
[ ツッコむ ]
以上です。