TIPS・小ネタ

Last-modified: 2023-10-18 (水) 22:56:55

Mitsua Diffusion Oneのモデルについて

SD2.X系モデルとして

Mitsua DIffusion OneはSD2.X系であるため、追加学習や拡張機能の利用を行う時はSD2.X系に対応した設定にする必要がある。
解像度は512×512で、v-parameterizationは使用されていない。
ただし、Mitsua DiffusionのU-NetはフルスクラッチでありSD2ベースではないため、ControlNet等SD2.X系対応の拡張機能でも動かない場合があることは注意。
(例:ControlNetはSD2.X系のデータを入れると動作はするが、Reference~以外のものは入力した姿勢指定画像や深度画像などを反映しない。)

Mitsua Diffusion One-base

Mitsua Diffusion Oneと共に公開されているMitsua Diffusion One-baseは数万枚以上の大規模なファインチューニング向けのモデルである。
1000枚以下の追加学習なら通常モデルを使う方が良い。*1
通常モデルはbaseにOffset Noise処理をしてVRoidの過学習を緩和したモデルとのこと。*2

学習(LoRAの作成)等について

上記の設定を適応すればLoRAの作成やMitsua DIffusion One+作成したLoRAのマージも可能である。
特に、過学習を利用したコピー機学習法は権利的にクリーンな画像とその加工画像の最低2枚から行えるので
比較的簡単に利用規約やライセンスに抵触しない範囲でLoRAが作成可能である。

お役立ちツール・サイト

Seamless Texture Checker

URL:https://www.pycheung.com/checker/
簡単に画像をタイリングして見れるサイト。
WEB UIで作成したシームレステクスチャ等の確認に。

DeepL翻訳

URL:https://www.deepl.com/ja/translator
翻訳サイト、プロンプトに使いたい単語の翻訳に。
Chrome拡張を導入すると、WEBUI上やWEB版discord上(step3での生成)で直接翻訳可能になる。