pony_diffusion_v6

Last-modified: 2025-08-10 (日) 18:29:43

SDXLシリーズの中でも人気を博しているモデルの一つ。
うまキャラクターメインの本家と、その表現力を借りたマージモデルがあり、マージモデルが人気。



pony diffusion v6

アニメイラストの出力に長けているSDXLモデルの一つ。『My Little Pony』という海外の馬(ポニー)アニメに特化したモデルなのでpony。
v5までは普通にアニメシリーズ用のキャラ収録モデルだったのだが、SDXL対応したv6でエロと裸体の表現力を買われて爆発的に認知された。
2025年現在はv6を元にして人間キャラクターや人間イラストを大量に混ぜたマージモデルの利用が一般的。v6本体を研究する意味も利用するメリットもない。
派生モデルを参照のこと。通常のマージモデルはモデルの説明部分にプロンプトの書き方が載っているのでそれを使う。v6本体のプロンプトの書き方はけっこう特殊だが、マージモデルでは守る必要性がない。マージモデルの指示に従う。

ただし、細かい話ではあるがAnimagineと違って利用時にクレジット明記必須のモデルであることに注意が必要。
生成した画像を公開する際には「generated by pony diffusion V6(trained by PurpleSmartAI)」と書き添えるなどクレジット表記をしなければいけない。
pony_permissions.png
また「マージモデルに本家と違う許諾をつける」も✕であるためponyは派生モデルも全てクレジット明記必須のモデルとなる。
有名どころだとAutismMixなどがクレジット明記不要モデルになっているが、この許諾はponyをマージに利用する際の規約違反となっているためAutismMix等の利用時もクレジット明記を推奨する。
(ただし元々権利関係が明確でない分野でもあり、クレジットを付ける/付けないことに何らかの法的な裏付けがあるわけではない点は留意したい)
生成した画像の商用利用は✓になっているが、PurpleSmartAIへの連絡が必須。これも全ての派生モデルで同じ条件である。
(禁止されているのは収益化を行っているアプリ、サイト等での推論であり、生成した画像の収益化については制限は存在しないと公式から返答を貰ったと主張する人も存在するなど生成した画像の商用利用については、利用者の間でも解釈が分かれている。)

余談だが、ponyとそのマージモデルが登場時注目され、得意とした「プロンプトを書くだけで2人の(エロい)絡みが出しやすい」は、2025年の環境ではさほどのメリットにはなっていない。若干の時間を割いて1人ずつ描いて合成すればいいだけだからである。登場時は端末処理スペックやライブラリのこなれてなさもあって、理屈上は可能だがそんなにうまくはいかねえよという絵に描いた餅だったのだが、2025年だとわりと現実的である。
そのためか、モデル公開サイトなどでもponyマージモデル(と、LoRA)の勢いは下火である。みんながみんな多画像合成できるわけではないしプロンプトひとつでポン出しするメリットもあるので絶滅はしないとは思われるが、最初に選ぶ・勧めるモデルとしては最早弱い。特にキャラ1人でいい場合。

なので、仮に次バージョンのpony diffusion v7が登場したとしても、それはv6のように部外者の困りごとを解決するような動作はせず、単にMy Little Ponyのファンしか使わないモデルになるはずである。
…はず、である。

(v6専用)設定

詳細はCivitAiのページを参照のこと。ただし公式の言う通りにすると絵柄がバタ臭いのであまり参考にならない。
以下にタグの付け方をごちゃごちゃ述べていくが、Civitaiのサンプル画像やスレに上がってる画像からこれぞというものを選んで呪文をパクって勉強させてもらうのが一番早い。

(v6専用)プロンプトの記述方法

公式が推奨するタグの順番は(スコアタグ),(品質タグ),(キャラや動作など描きたいもののプロンプト),(補足のタグ)となっている。
ponyは高精度キャプションのおかげで自然言語の理解力がある程度あるため、どういう人物が何をしているかという部分は普通の英文で記述しても良い。
自然言語だけで出ないとき補足としてタグをつける…ということになっているが、どちらかというとSD1.5でやってきた通りタグがメインで英文が補足という記述法が多い。

  • スコアタグ
    score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_upというpony独自のタグを使う。
    ponyでは学習に用いた画像に独自のAI及び人力によって4~9点のスコアを付けてタグ付けしている。score_9は9点、score_8_upは8点以上、score_7_upは7点以上の画像を参考するという意味。
    公式はscore_6_up, score_5_up, score_4_upまで載せているがぶっちゃけscore_9, score_8_up, score_7_upまでで大丈夫。
    むしろscore_6, score_5, score_4はネガティブプロンプトに放り込んだほうがいい。
    • なお他のモデルで使うと'score+数字'の部分が得点や点数と解釈されてしまい、時々数字が出てきてしまうのでpony以外では非推奨タグとなる。
  • 品質タグ
    モデル本来のポニーやケモノを描く場合には公式通りスコアタグが完全に効くので品質タグは本質的に不要。
    しかし、ponyに収録されている人間の絵を引っ張ってくる場合は、人間の絵のデータソースで使われているmasterpieceやhdなどの品質タグが有効。
    さらに日本の文化に近い絵柄にするためにbest quality, official art, official style, anime_cap, game cg, megami magazineなどのタグを利用するのも良い。
    very aesthetic, absurdresといった品質タグもよく使われている。
    またいくつかの作品が画風をバタ臭い方向に寄せているため、the simpsons, overwatch, apex legendsなどの作品名をネガティブに入れている場合がある。
  • ソースタグ
    pony独自の品質タグで、「source_pony」、「source_furry」、「source_cartoon」、「source_anime」の4種類があり、学習した画像の大まかな出典を意味している。
    ponyはポニー(原型・擬人化含む)、furryはケモノ・獣人、cartoonは海外風のカートゥーン、animeは日本風のアニメという意味。
    基本的にはsource_animeをポジティブプロンプトに入れて、source_pony, source_furry, source_cartoonをネガティブに入れて使うことになるだろう。
    もちろん可愛い動物のえっちな絵や海外アニメの画風再現絵を出したければsourceタグを適切にポジティブに入れて使おう。
  • レーティングタグ
    ponyでは画像のエロ・非エロを指定する際、既存のSFW/NSFWタグではなくrating_safe、rating_questionable、rating_explicitという3つのタグを使う。
    rating_safeは下半身性器なしで性行為なし、rating_questionableは下半身性器なしで性行為あり、rating_explicitはそれ以外全部である。
    レーティングを書かないと「レーティングを気にしない」とみなされて下半身性器が普通に出るので、非エロ画像を出したいときはrating_safeを必ず指定しよう。
    なお、エロでない水着はsafeで、乳首・食い込み・ギャランドゥはquestionable扱いである。

(v6専用)その他の設定

(v6専用)画像サイズ

  • 1024×1024をベースとして以下のサイズがサポートされている。
    • SD1.5のように512×512などの小さいサイズを出そうとすると露骨に品質が落ちるので注意。
サイズアスペクト比
1024*10241:1
1152*896
896*1152
9:7
7:9
1216*832
832*1216
19:13
13:19
1344*768
768*1344
7:4
4:7
1536*640
640*1536
12:5
5:12

(v6専用)キャラクター名やシリーズ名で出せるキャラ

公式では記載されていないが、本家を含めPony系のモデルでも、Animagine XLIllustrious-XL系のように、名前とシリーズ名の入力だけで出力可能なキャラクターが存在するAnimagine XL 3.1では対応していない、もしくは再現度が低いキャラクターについても、ある程度は対応しているようだ。

どんなキャラが対応しているかを調べたい場合は以下のサイトがオススメ。

  • Pony XL Character Prompts - 下記のサイトよりは少なく女性キャラのみだが、再現率についての記述があり信憑性も高い
  • Pony Diffusion Characters List - 再現率を示すアイコンはあるが信憑性は低い。しかし各キャラの詳細ページに4枚ずつ画像があり、そこで実際の再現率を確認可能。

派生モデル

ponyの絵柄制御がとても難しいため、様々な絵柄を持つ派生モデルがいくつも公開されている。そのうち代表的と思われるものをいくつか紹介する。
pony本家の絵柄をタグで調節するより簡単に日本の文化に近い絵を出せて、プロンプト記述が簡単になるので積極的に利用しよう。
(そもそもponyの収録物の大部分は西洋系なので、残りの東洋系部分を無理して使っていたこれまでがおかしいと言えばおかしい…)
もちろんここで紹介したもの以外にも様々な派生モデルがあるのでCivitai新着漁り沼に飛び込もう。

サンプルイラストのプロンプト

pony diffusion本家
・ポジティブ
score_9, score_8_up, score_7_up, rating_safe, masterpiece, best quality, absurdres, unity 8k wallpaper, official art, official style, source_anime, uncensored, game cg, megami magazine, ultra delicate hair, 1girl, pink hair, blue eyes, medium breasts, cheerleader, dancing, floating hair, sweat, open mouth, smile, one eye closed, looking at viewer, holding pom pom \(clothes\), park, sky, tree, grass field
ネガティブ
score_4, score_5, score_6, worst quality, low quality, normal quality, lowres, bad anatomy, bad hands, text, error, missing limb, missing fingers, extra digit, fewer digits, extra arms, extra fingers, multiple fingers, cropped, artifacts, signature, watermark, username, monochrome, greyscale, flat color, realistic, 3d, video, source_filmmaker, artist name, source_pony, source_furry, source_cartoon, mature female, the simpsons, overwatch, apex legends

・派生モデル(本家に比べて品質タグがいくつか簡略化されている)
ポジティブ
score_9, score_8_up, score_7_up, rating_safe, masterpiece, best quality, absurdres, 8k wallpaper, source_anime, uncensored, 1girl, pink hair, blue eyes, medium breasts, cheerleader, dancing, floating hair, sweat, open mouth, smile, one eye closed, looking at viewer, holding pom pom \(clothes\), park, sky, tree, grass field
ネガティブ
score_4, score_5, score_6, worst quality, low quality, normal quality, lowres, bad anatomy, bad hands, text,error, missing limb, missing fingers, extra digit, fewer digits, extra arms, extra fingers, multiple fingers, cropped, artifacts, signature, watermark, username, monochrome, greyscale, flat color, realistic, 3d, video, source_filmmaker, artist name, source_pony, source_furry, source_cartoon, mature female

  • CLIP skip……2
  • steps: 30, Sampler: Euler a, CFG scale: 7, Seed: 183635651, Size: 896x1152

二次元系
サンプル画像はクリックすると拡大します。

pony_diffusion.jpgpony diffusion V6
ご本家。ちょっとタグをいじるだけで絵柄がガラッと変わってしまうのが表現力の広さとも言えるし暴れ馬とも言える。ムラが大きく、たまに派生モデルを超える結果が出る事も。
generated by pony diffusion V6(trained by PurpleSmartAI)
autismmix.jpgAutismMix
手足の破綻に強く構図作りも優秀。このモデルを出力先として推奨するLoRAも多い。本家に近い振る舞いをするので初めてpony触る人向けではないかも。後述する三文字やLoRAなどで画風を調整して使いこなせると強いのだが。
generated by AutismMix SDXL(merged by Autismix_anon)
ebara_pony.jpgebara pony
作成者曰く適当に作ったらしいが非常に出来がよく愛用者は多い。CivitaiではなくHuggingfaceから入手できる。
generated by ebara pony(merged by tsukihara)
ebara_ponyv21.jpgebara pony ver2.1
ebaraの新バージョン。v1ほどタレ目じゃないらしい。画風やLoRAの効きに差異があるのでver1との使い分けはお好みで。
generated by ebara pony(merged by tsukihara)
hanamomo_pony.jpghanamomopony
ぷにロリ系の甘い絵柄になる派生モデル。同作者のmomoiro ponyも有名。このモデルに限らず可愛い系は背景が甘くなりがち。
generated by hanamomopony v1.4(merged by oritatami_neko)
7thanime.jpg7th Anime XL pony
SD1.5の頃を思わせるいかにもAIっぽい絵が出るのでAI絵の絵柄が好きな人に。
generated by 7th Anime XL pony(merged by syaimu)
3x3x3mixxl.jpg3x3x3mixXL
背景が弱いpony系とは思えないくらい色々書き込んでくれる。ややクセが強い。
VAEは焼き込んでないので自分で用意する必要がある。
generated by 3x3x3mixXL pony(merged by ichigodaifuku)
omegapony.jpgOmega Pony XL anime style
独特な透明感のあるフラットカラーが特徴。
generated by Omega Pony XL(trained by kitarz)
whiteunicorn.jpgWhite Unicorn
ぷに系のモデル。LoRAとの相性が素直なので根強いファンがいる。
generated by White Unicorn(merged by Gyunyu_pudding)

フォトリアル系

RunBullXL.jpgRunBullXL Pony
実写に特化したモデル。本家Ponyは二次元アニメ絵が得意なモデルだが、実写対応の派生系もある。フォトリアルでエロを描きたいならこれがおすすめ。プロンプトはCivitaiのページを参考にしよう。いくつかPony特有の指定が必要だが、それ以外はSD1.5の感覚でも通用する。プロンプトに素直に応じてくれるモデルだ。
generated by RunBullXL Pony(trained by EEB)
swampony.jpgSwamPonyXL
アジア系の顔に強いモデル。布の質感や髪色の馴染みが自然で、アニメキャラを出すためのプロンプトをそのまま流用するだけで実写のコスプレイヤーになる。背景など人物以外がやや弱いか。
generated by SwamPonyXL(trained by mmtrs)
waireal.jpgWAI-REALMIX
光の処理の仕方が若干二次元系に寄ったいわゆる2.8D系のモデル。マンガ的な嘘をフォトリアルで再現しやすく、顔もアジア系から白人系まで広く出る
generated by WAI-REALMIX(merged by WAI0731)

その他のTips

  • 「三文字」
    ponyの学習を行う際に作者名やキャラ名をそのままタグにするのではなくランダムな三文字の文字列に置き換えて管理していることが有志の調査で分かった。
    ※作者のコメントにより故意に行っている事が判明。
    どうやら版権を出す事を避けたかったらしく、次に削除する事も検討している。との事。

詳しいことは有志の調査(通称ポニーノート)を見てもらうとして、これが何を意味するかというと自分の出したい絵柄やキャラの「三文字」を見つけたらそれをプロンプトに入れるだけでばっちり原作再現できてしまうということである。
また明らかにケモやバタ臭い画風を学習している「三文字」をネガティブに入れることでそういった絵柄に寄ることを防ぐこともできる。
ただし、特定のタグに特定の作家の作品を集中的に学習させる行為への法的・倫理的是非はこの場では触れないこととする。その理由として、特定作家の画風を呼び出すだけではなく、複数の「三文字」を利用して作風をミックスしたり、ネガティブに入れて特定の作風を遠ざけたりといった「三文字」の利用法の広さもあるが、それ以上に法律の素人がここでごちゃごちゃ述べても何の担保も出来ないという面が大きい。
pony系列のモデルの話題のときによく出てくる概念なので知識として紹介はするが、「三文字」を利用した場合の法的・倫理的安全性を当wikiとして保証するという類のものではない。
AIによって生成された画像は全てAI利用者の自己責任である。

前置きはここまでとして、まずaaxという「三文字」を例にしてその効果を紹介する。
aaxはフォトリアル系のモデルをアニメ風に置き換える効果がある。
generated by SwamPonyXL(trained by mmtrs)
aax.jpg
左がaaxをプロンプトに入れたもの、右が入れていないもの。この「三文字」は身体が破綻しにくいフォトリアル系の利点を残したままアニメ風モデルとして使う場合に利用される。
このようにたった三文字で画風を大きく変更してしまう効果が「三文字」にはある。

とはいえ画風を独自に調整している派生モデルを利用するなら「三文字」が必須というわけではない。
例としてpony本家と派生系モデルの一つであるepona mixで「三文字」の効果を比較する。

R18画像を含むため閲覧注意

次の画像はカートゥーン系の画風の「三文字」をネガティブしているものが左、していないものが右である。

generated by epona mix v3(merged by K4gtuTi)
epona3moji.jpg
目元や塗りにいくらかの差はあるが正直この程度の差なら品質タグやLoRAでどうとでもなる差でしかない。

一方で本家ponyで「三文字」ネガティブした場合(左)としない場合(右)はこうなる。
generated by pony diffusion V6(trained by PurpleSmartAI)
pony3moji.jpg
このように本家や本家に近い派生モデルでは「三文字」の影響が大きく、カートゥーン系の画風を遠ざけた結果フォトリアルに近い絵が出力されている。

入力したプロンプトが偶然「三文字」の何かを踏んだだけでガラッと絵柄が変わってしまうので、まずは画風が安定している派生モデルの利用をオススメする。
またLoRAを作る際にはトリガータグや独自の学習タグが「三文字」とかぶらないようにすると親切だろう。

  • Civitaiにpony専用絞り込みが出来た
    filterからponyを選ぶことでponyベースのLoRAだけを表示できるようになった。
    ファイルの種類の横のお馬さんマークがponyベースの表示である。
    pony_filter.png
    ponyをベースに学習したモデルでないと機能しないのでありがたい。

FAQ

なんか変な色合いのイラストが生成されたんだけど

SD1.5系列のVAEとは互換性がないため、SDXL用のVAEを利用すること。1.5用のVAEを利用すると色合いがおかしくなる。
VAEを焼きこんであるモデルを使っていて変な色の絵が出たとき、VAEの設定をAutoにしている場合はNoneにすること。

時々ノイズまみれのイラストが出る

pony というよりは WebUI の不具合。Fooocus などもこれを継承する。プロンプトの順番等を入れ替えたり強度を変えたりする事で治るならばこの不具合。
WebUIの設定>Stable Diffusion>Emphasis Modeを「No norm」に変更すると改善する。再起動も忘れずに。

Fooocus なら modules/patch_clip.py の patched_encode_token_weights() 内の下記行を削除なりコメントアウトなりすればよい。ただし自動 update のたびに修正が必要。

z = z * (original_mean / new_mean)

◯◯のpony用のLoRAが無い

ちょっとどうにもなりません。
weightを1.6とか1.8とかものすごく強調してやると効き始める場合もあるようだが、自分の使いたいLoRAがpony用でなければ使えないと思っておいたほうがいい。
いざとなったら自分で学習させてみよう。

クレジット表記をし忘れる自信しかない

わかる。
ちょっと中途半端な形になるが、プロンプトにクレジットを唱えてメタデータに埋め込んでおくという方法を紹介しておく。
呪文の最初や最後など分かりやすく、うっかり消しにくい位置に、例えばpony本家であれば[pony diffusion V6 is trained by PurpleSmartAI:100]と書いておく。
[~~~~~:◯]という表記は[ ]内のタグを◯ステップ目から有効にするという記述になる。
そのため◯のところに100のような通常の生成にかけるstep数を大幅に超えたでっかい数字を入れておけば、メタデータとして残るが画像生成中は機能しないタグとして使うことができる。
ただしモザイクをかけるなどの画像編集でうっかりメタデータを消さないように注意。
Windows標準でついてくるペイントが、上書き保存してもメタデータを消さないペイントソフトなので、手描きのお絵描き関連ソフト充実してない人も上手く活用しよう。
MSペイントで開く→Jtrim等の他のソフトでモザイクかけた画像をペイントで開いた画像にコピペ→ペイントで保存するとメタデータを消さずにモザイクをかけられる。
もちろんとしあき製の拡張機能などメタデータを消さないモザイクツールを利用しても良い。

Pony系をなるべく高速に描画したい

SDXL LightningとかLCM LoRAのように高速化することはできる。Hyper-SD LoRAを使おう。
CFG と Sampling Stepsを大幅に減らすことができるので高速だ。
筆者は CFG 1 , 8 steps で描いているので低スペック環境でもあまり遅いと感じない。
XLの重さは、なんらかの手法で高速化したほうがいいだろう。そのうちの1つとしてHyper-SD LoRAは優秀だ。

Pony系のモデルでどんな絵が出るか知りたい

アニメ系は各Pony系の出力結果をcivitaiでまとめているページがあるため、そこで調べてもらえればと。
表現比較の関係でR18画像を含むため、アクセスは自己責任で。

Pony系のモデルで服装や髪型が思った通りに出力できない。

AutismmixSDXLで出力された物がcivitaiにまとまっているため、調べてもらえればと。
服装
髪型(更新中?)
アクセサリ(今後追加?)
モデルによって効くプロンプトと効かないプロンプトがあるため参考程度で。

他にも一通りの出力結果をまとめた記事があるため、参考にしてもらえれば。こちらはR18表現有。
各種プロンプトの出力一式