mieki256's diary



2023/04/10(月) [n年前の日記]

#1 [cg_tools] 画像生成AI Stable Diffusion web UIを試用中

画像生成AI、Stable Diffusion web UI をローカル環境にインストールできたので、英単語や英文を打ち込むと画像を生成してくれる txt2img に色々な単語を打ち込んで試していたのだけど。狙った感じの画像を生成するのが難しいなと思えてきたので、画像から別画像を生成できるらしい img2img について調べ始めているところ。コレを使えば生成画像の修正ができるらしいのだけど…。

とりあえず、今現在の雑感をメモ。

8bit PC時代のアドベンチャーゲームっぽい :

txt2img を試用しているうちに、8bit PC時代のアドベンチャーゲームを思い出してしまった。

当時のアドベンチャーゲームは、動詞や名詞をキーボードから打ち込んで遊ぶスタイルだったのだけど…。大体以下のような感じのプレイスタイルで…。
> ドウスル?
look

> ナニヲ?
door

> カギガカカッテイル。
> ドウスル?

そのゲームの中に、どんな単語が登録されているか分からないから、とりあえず思いついた単語を手当たり次第に打ち込んでみて、当たりが出たら先に進める、てな感じで…。「デゼニランド」というゲームで、attach という単語が思いつかなくて、そこから先に進まなかったりしたっけ。

画像生成AIのプロンプトも、学習モデルデータにどんな単語が登録されているのか、どの単語がどんな効果を発揮するのか、そのあたりが今一つ分からないものだから、思いついた英単語を打ち込んで様子を見て、また別の単語を打ち込んで、という感じになっちゃうなと。

21世紀に蘇ったattach族だよなと…。動かしているハードウェアのスペックも、AIが行っている処理も、当時とは比較にならないゴイスなレベルなのに、コンピュータの前に座ってる人間は、当時と変わらず、attach族…。

ちなみに、アドベンチャーゲームは、動詞や名詞を一々打ち込むスタイルから、後に、メニューから動詞や名詞を選んだり、画面上に描画された絵のどこかしらをクリックすると状況が変わる、というスタイルに変化していったのだけど。それを考えると、こういった画像生成AIも、メニューから単語を選んだり、生成画像に対してマウス操作をすると結果が変わる、といったスタイルに変化していくのだろうなと。いやまあ、ポーズを指定できる ControlNet や、画像から別画像を生成できる img2img がそのあたりに相当するのかもしれないけれど。

学習してないモノは出てこない :

当たり前だけど、学習していない画像に関しては生成結果に出てこないので、なんだか残念だなと感じる瞬間があるなと…。例えば、「ガンダム」や「ドラえもん」と打ち込んでみたら、「ガンガル」や「うまえもん」にすら近づけていない珍妙画像が出てきてしまって、なんというか…。

でもまあ、人間だって、「ガンダムを描け」「ドラえもんを描け」と言われたら、フツーの人は珍妙な謎キャラクターを描いちゃうわけだから、そう考えると、AIも人間と同じ、なのかもしれない。しっかり学習してないものは、AIも、人間も、出力できないよな。

以上です。

過去ログ表示

Prev - 2023/04 - Next
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30

カテゴリで表示

検索機能は Namazu for hns で提供されています。(詳細指定/ヘルプ


注意: 現在使用の日記自動生成システムは Version 2.19.6 です。
公開されている日記自動生成システムは Version 2.19.5 です。

Powered by hns-2.19.6, HyperNikkiSystem Project