今噂のAI描画で色々作ってみる上での備忘録と誰かの参考になればと。
まずStable Diffusion自体はオープンソースというもので他のAIと違い有料ではない。
ただし導入が糞面倒だった
(プログラムの基盤ダウンロードから始まりモデルがどうのと5連鎖くらい必要で
しかも説明通りにやってもなぜか動かなかった)。
しかし現状ですでに3つくらいは実行ソフトが存在する。
・
Stable Diffusion GRisk GUI 0.1多分一番誰でも動きそう?ただし制約が多い
(img2img(特定の画像を参考に画像を作成する)が使えなかったり作成サイズが小さい)
・
NMKD Stable Diffusion GUI特定のグラボがないと動かないソフト。
私は入れたけど実行しても出力されなかった。
・
Artroom Stable Diffusion私が今利用してるソフト。
ノートパソコンのほうにも入れてみたが処理自体はしてる風だが
ただの緑色の画像しか出力しないため、ある程度のグラボ性能がないと動かない模様。
今回はこれを使った前提の話になります。
この他にもgoogleアカウントを持っていれば低スペックPCでも関係なく使えるweb上で動作するものもありますが、おそらくこのサイトを見るような人が作りたい画像をこちらで作ると垢banされてしまうのではないかと思います。
上記含め以下もやる場合は自己責任でお願いします。
まず画像を生成するには一般的に呪文と呼ばれているpromptが必要になります。
promptは英語のため翻訳サイトを使うか、単語の羅列でごまかすしかありません。
prompt(呪文)の参考サイト画像の良し悪しは後で説明するパラメータも影響はしますが、正直prompt(呪文)とseed値(開始の指標値)の2つがほとんどです。
まずstepsですが、これはほぼ50でいいです。

左からsteps60/120/150ですがほとんど変化がないことがわかります。
写実的な絵を欲しい場合はstepsを上げたほうがいいでしょうがこういった絵ではsteps50でいいです。
以下promptは全部
a detail illustration of hypnotized girl, her empty brainwashed eyes and dazed,Violet Evergarden,pixiv.
seed値753495648
で統一した場合の比較画像です。
左からCFGScale 4/8/11/22/30
先人たちのいうように7-9くらいがいいっぽいです。
低すぎるとやたらぼやけるが、高すぎると変な感じになる。
次はSamplerごとの違い。
Samplerは1枚作製ならそこまで気にする必要ないかもしれませんが、
複数同時作成だと設定しないと意味がなかったりします。
また時間にもわずかに影響します。
まずplms、3枚作製で7分
同じものが作成されます。次にddim、5分
plmsよりは短いですがplmsと同じ画像が3枚同じに出力されてしまいます。
次にお勧めがk_euler_ancestral、7分
3枚別々のものが作成され、上よりも若干アニメ調っぽさがあります。
次はk_dpm_2_ancestral、14分もかかります。
2倍かけた割に上よりやぼったさがもあります。出力は似通ってます。
最後にk_lms、7分
出力的にはplmsとancestral混ぜたような感じですね。
2枚目でなぜか2人目が登場してます。
次はimg2img(画像を参考に画像を作成)でのパラメータ
Change init image strength

上を参考画像として
左からstrength 0/0.2/0.4/0.6/0.8/0.99





0はそのまま出力しますね。0.8でやっと崩れ始めて0.99だともはや面影がほぼない感じです。
後はまぁひたすら出力するだけです。ちなみに同時に何枚作れるかはPCスペックによります。
自分は12枚(img2imgだと6枚)が限度です。動かしてみて画像を出力しないでfinishが表示されたら限界超えてます。
同じ呪文、設定でもseed値(開始値)違うだけで以下のように違うので呪文とseed値を変えてひたすら生成しまくることでいい具合の画像に出会うこともあるだろう、という感じになります。