項目解説

Last-modified: 2023-04-01 (土) 22:01:04

全てはここを見れば解決するかもしれない
公式wikiの機能解説
→ https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features

txt2img

文章や単語など、AIへの文字で指示を与えて画像を生成させる機能。最も基本的な機能。

プロンプトやGenerateボタン周辺

txt2img1.png

Prompt欲望を入力する欄です。ここに入力する内容のことを「呪文」と呼ぶ人もいます。
例:1girl, solo, upper body, smile,
Negative prompt出てきてほしくない要素を入力する欄です。
例:(worst quality:1.4), (low quality:1.4), (monochrome:1.1),
Generate
/Interrupt
Generateを押すと画像生成が開始されます。
Ctrl+Enter、またはAlt+Enterのショートカットキーで開始させることもできます。
また、生成中はボタンがInterruptボタンに変わります。
Interruptボタンを押すと、画像生成が中止されます。
最後に使用したプロンプトや設定を、履歴から呼び出します。
主に、1111を起動した直後などに使用します。
🗑プロンプトおよびネガティブプロンプトを空欄に戻すためのボタンです。
🎴LoRAやTIなど、追加の学習データを読み込んで画像生成に利用するためのボタンです。

📋💾Styles🔃
これらはスタイル機能のためのボタンです。
スタイルとは、ユーザーが作成するテンプレートのようなものです。
よく使うプロンプトやネガティブプロンプトの一部を保存し、後で手軽に呼び出すための機能です。

  • プロンプトまたはネガティブを入力した状態で💾を押すと、スタイルの名前を入力して保存することができます。
  • 保存したスタイルは、Stylesのプルダウンリストから選択できます。
    選択した状態で📋を押すと、確定され、実際に適用されます。
  • スタイルの内容は「styles.csv」に保存されています。
    編集や削除を行うためには、このファイルを直接編集する必要があります。

左下のパラメータ

(Tips)

  • この辺のUIの並び順は、設定でカスタマイズが可能です。
    Settings → User interface → txt2img/img2img UI item order
  • Width/HeightとBatch size/Batch countのUIを分割することもできます。
    Settings → User interface → Show Width/Height and Batch sliders in same row
  • 設定を変更した後、ページ上部の「Apply settings」を押して適用させる必要があります。

txt2img2.png

Sampling method通称サンプラー。画像生成に利用するアルゴリズムの種類。
 誘導→よくある質問#サンプラーはどれがいいの?
Sampling steps画像を改善する処理を何回繰り返すかの設定。
多ければ多いほど良い結果を得られるというわけではありません。
あまり多くても頭打ち感が強くなります。
何より、画像生成の所要時間に直結します。
 誘導→よくある質問#step数はどれくらいがいい?
Restore faces生成される画像の顔部分に補正処理を行うオプション。…なのですが、正直な話、あまり良い結果を得られません。古い機能でもあり、実写向きの機能でもあるからです。
特に二次元美少女を出力する際はOFF推奨。
Tilingその名の通りタイリングできます。つまり上下左右に繋ぎ目無く、綺麗に繋げられる画像を出力するためのオプション。
テクスチャや模様を生成したい場合にのみ利用します。
美少女を出力する際などにはOFF推奨。
Hires.fix大きな画像を出力する際に、工程を2段階に分けることで構図の破綻を抑えようという機能。詳しくは後述。
Width生成する画像の横幅。値を大きくすると、より多くのVRAMが必要になります。
Height生成する画像の高さ。値を大きくすると、より多くのVRAMが必要になります。
 誘導→よくある質問#大きな画像生成についてもっと教えて?
WidthとHeightの値を入れ替えます。縦横比を入れ替えたい時に利用します。
Batch count画像生成処理を繰り返す回数。VRAM使用量には影響しません。
Batch size同時に生成する画像の枚数。VRAM使用量に影響します。
(例) Batch count=3、Batch size=2にすると、画像を6枚生成する。(2枚同時x3回=6)

txt2img3.png

CFG Scale指示したpromptにどの程度従わせるかの強さ。上げ過ぎると画像が崩壊する可能性が高まります。
下げるとpromptに従いにくくなりますが、AIにとっての自由裁量の範囲が広がるため、いい結果を得られることもあります。
使うモデルデータによって最適な数値が異なり、モデルデータがあるページに書いてあることが多いです。
5~9ぐらいが良く使われるようです。
Seed画像生成の計算に使用する乱数。この値が1違うだけでも違う画像を出力します。
「-1」はランダムという意味です。
最大値は4294967295だった気がする…。
🎲️Seedを「-1」に戻します。
♻️最後に利用したSeedを再利用します。
☐Extra(後述)

Hires.fix

大きな画像を出力する際に、工程を2段階に分けることで構図の破綻を抑えようという機能。
まず1段階目は、モデルが得意とするサイズで普通に生成する。
次にその画像に補正をかけつつ拡大する。
さらにその結果を元画像にしてimg2imgを行う。これが2段階目。

(注意)
txt2imgの一部のサンプラーで問題が確認されています。

  • DPM fastは非推奨です。生成結果の画像が明らかにおかしくなります。
  • DPM adaptiveは非推奨です。極めて長い計算時間(他のサンプラーの3~4倍)を要することがあります(というか確実そう?)。
  • PLMSまたはUniPCを選択していても、2段階目の工程には自動的にDDIMサンプラーが使用されます。
    これはPLMSおよびUniPCサンプラーがimg2imgに対応していないからです。

Hiresfix.png

Upscaler1段階目と2段階目の間の、拡大および補正処理に用いられるアップスケーラーの種類です。お好みで。
Hires stepsHires.fixの2段階目のステップ数。0にすると「Sampling steps」と同じステップ数が用いられます。
「Sampling Steps」の1/2~1/4が目安と言われますが、0でも十分でしょう。
Denoising strength重要な項目。小さいほど1段階目に忠実になりますが、同時にぼやけがちになります。値が大きければ精細になりますが、元画像からの乖離も大きくなります。
適正値はアップスケーラーや拡大率、好みなどによっても変わります。
例えばLatentで1.5~2倍の場合、おおよそ0.55~0.6くらいでしょうか。
Upscale byHires.fix利用時の拡大率。
倍率を高めると最終的な画像サイズが大きくなり、より精細な結果を得やすくなります。その半面、所要時間も劇的に長くなります。例えば縦横それぞれ2倍なら面積は4倍になるからです。
時間が掛かるので1.5~2倍程度で良いでしょう。
Resize width to画像の最終的な横幅。0以外にすると、Upscale byで指定した拡大率よりもこちらの設定が優先されます。
Resize height to画像の最終的な高さ。0以外にすると、Upscale byで指定した拡大率よりもこちらの設定が優先されます。

(2023/3/20) ↑ここまで内容をアップデートした
↓ここから下は基本的に旧としあきdiffusion(rentryのやつ)から移植した頃(2022/10頃)の内容です。

★□Extra

  ここに☑をいれると
  ★Variation seed
  ★Variation strength
  https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features#variations をチェック
  と
  ★Resize seed from width
  ★Resize seed from height
  https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features#seed-resize をチェック
  の★した4個が現れます

★Script

  ★None
  ★Prompt matrix
   ★□Put variable parts at start of prompt
  ★Prompts from file or textbox
   切り替えた場合だと 「File with inputs」と「Prompts」の2つが表示されてるかもしれませんが、それはおそらくバグです。
   ★□Show Textbox
   「File with inputs」画面を表示させます。「ここにファイルをドロップ-または-~~以下略」にtxtファイルを入れると
   そのtxtファイルの中身通りに画像を生成してくれます。
   この時Negative Promptは上のが有効です。
   ★☑Show Textbox
   「Prompts」の画面を表示させます。そこに縦書きに書いていくことで上から順番にpromptを実行して画像を行数分生成できます。
   この時Negative Promptは上のが有効です。
  ★X/Y/Z plot
   比較などをするときに利用します。
    誘導→X/Y/Z plot
 

★★img2img

 ※txt2imagと同じ個所は説明を省略します。
 ★Interrogate CLIP
  入力した画像からPromptを生成します。
 ★Interrogate DeepBooru
  入力した画像に対してDeepdanbooruを利用しpromptを生成します。
  danbooruのタグが出ます。
  http://dev.kanotype.net:8003/deepdanbooru/

★★Extras

 ★Resize
 ★Upscaler 1
  ★None
  ★Lanczos
  ★LDSR
   初回利用時めちゃくちゃ長いダウンロード入る
 ★Upscaler 2
 ★Upscaler 2 visibility

★★PNG Info

 ★Source
  ここにpng画像をいれることでその情報を見ることができます。
  Software NovelAIと出たらNovelAI製の画像です。
 ★Send to txt2img
  取得した情報をtxt2imgへ送ります。
 ★Send to img2img
  取得した情報をimg2imgへ送ります。

★★Checkpoint Merger

★★Train

こちら⇒https://wikiwiki.jp/sd_toshiaki/Textual%20Inversion%20on%20AUTOMATIC1111

★★Settings

___________________________________________________

指摘・更新するべき箇所や助言など

  • ↙️ボタンは俺も機能しないや
    生成画像をプロンプト欄にドラッグして↙️押すとPNG Infoのタブに移らずともプロンプト取得できる小技もヒで目にしたけどそれも機能しない -- 2023-03-16 (木) 23:13:34
  • アップデートしたら、それ以降Upscale byのバーが項目ごと消えちゃったんですけど、理由って分かりませんか? -- ? 2023-04-01 (土) 21:25:10
  • (1) その辺はHires.fix関連の項目なので、Hires.fixのチェックボックスをONにしないと出現しません。まずこの点を確認してみてください。
    (2) 次に確認したいのはSettings → Compatibility です。4つあるチェックボックスの一番下、「For hires fix, use width/height sliders~」がONになっている場合は、Hires.fixのUIが2022年12月以前の古い方式になるので、Upscale byのスライダーは表示されなくなります。アプデにより勝手にONされるとは考えにくいですが…。
    (3) 最後に、ただ単に1111本体のアプデと拡張機能との相性により、UIの一部に問題が発生する可能性が一応あります。この場合、該当する拡張機能を一時的に無効化するか、本体または拡張機能のアプデを待つ必要があります。 -- 2023-04-01 (土) 21:59:38