過去の出来事05

Last-modified: 2025-11-28 (金) 00:16:06

1ページ最大1600行という行数制限があるので、最近の主な出来事の内、古くなった内容はこのページに移動されます。


2024/8

2024/8/23 Pony v7続報

前回までのあらすじ

  • (8/31) Civitai: Pony Diffusion V7に向け、流れに乗って
    後日公開された日本語記事。
  • (8/23) Civitai: Towards Pony Diffusion V7, going with the flow.
    翻訳元になった英語の原文記事。
    大勢のCivitaiユーザーから多数のコメントやリアクションが付いているので、こちらも参考に。

    ちなみに"TL;DR"は"Too Long; Didn't Read"の略。
    「長すぎて読む気がしない」という人向けの要約。「今北産業」的なもの。

AuraFlow

SD3やFLUX.1と同様、群雄割拠の次世代モデル戦国時代に現れたモデルの一つ。AFと略されることも。

ローカル環境ではComfyUIが対応済み。
Forgeが対応するかどうかはまだわかんない。AuraFlowに対するイリヤちゃんの反応はこちら

もっと見る

ライセンスがApache 2.0に準拠しているので、商用利用可能。
これがPonyにとっては大きい。Ponyや兄魔神クラスともなると、大規模学習のためにクラウドの業務用GPUを長期間レンタルする必要があり、費用がかさんでしまう。
しかしモデルをリリースする際に商用化できれば、学習時の費用を回収したり、次の学習費用を賄えるからだ。
一方FLUX.1で商用化したい場合は、ライセンスの都合上[schnell]モデルに限定されてしまう。

AuraFlowは7/12にv0.1モデルが公開された。その後v0.2を経て、現在はv0.3が公開されている。
v0.3はそれまでのバージョンに比べ「う~ん……ちょっとどうなんだろうね」という評価。
とはいえ、v0.xという数字が示す通り、まだまだ未完成のモデルでもある。

参考までに、v0.1およびv0.3に対するRedditの反応を紹介。

ちなみにFalに参加しているSimo Ryu(cloneofsimo)氏は、SDにLoRAを実装した人でもある。
それまでのTIに比べ、遥かに短時間で学習できるようになった。
また、元のモデルが学習していないことも学習できるようになった。
そういった理由から2022/12~翌2023/2にかけて、TIからLoRAへの移行が進んだ。

Pony開発への支援

一般ユーザーがPonyの開発を経済的に支援したい場合は、
開発元であるPurpleSmart.aiのDiscord鯖に参加し、
「サーバーショップ」にて販売されている月額サブスク契約、
または単発のスポンサーシップを購入してほしい、とのこと。
 (参考) https://www.reddit.com/r/StableDiffusion/comments/1eyw6ub/comment/ljh6zry/

サーバーサブスクリプション
ロール付与[PONY][PONIER][THE PONIEST]
価格$2.99/月$4.99/月$9.99/月
備考・Discordの画像生成Botの優先権
・限定チャンネル「#wip」へアクセス可能
アイテム
名称Big $ SponsorBigger $ SponsorBiggest $ Sponsor
価格¥2,200¥6,390¥13,800
備考・次回のお知らせの際に、スポンサーとして名前を挙げてもらえる
 (該当者多数の場合は次回以降に繰り越し)

としあき達の反応

ついでにRedditの反応も。
(8/23) Towards Pony Diffusion V7, going with the flow.

もっと見る

102 無念 Name としあき 24/08/23(金)09:46:46 ID:kY9OxpW2 No.1248491690 そうだねx4
>噂通りAuraをメインでfluxはサブで作るみたい
Auraも生成試してるけど結構いい絵だすんだよね
エロに関してはFLUX以上に知らないけど

>ところで6.9はどこに…
まあなかった事にしてもいいんじゃないかなっ

111 無念 Name としあき 24/08/23(金)09:59:03 ID:ITl0QI06 No.1248493445 そうだねx6
たておつ

正直fluxが主流になったらもうスペック的についていけない

117 無念 Name としあき 24/08/23(金)10:36:40 ID:ksx5AQFw No.1248499050 そうだねx3
>>ところで6.9はどこに…
>まあなかった事にしてもいいんじゃないかなって
xlも完熟期だし近い内に次世代向けモデルがくるなら確かに必要はないか
しかし次もponyモデルが主流になるのであればタグ文化のままになりそうだね

127 無念 Name としあき 24/08/23(金)11:46:54 ID:3lStKL0c No.1248510556 そうだねx4
>fluxponyがきたらflux生成環境つくらなきゃ
>SD3かfluxベースのNAI4とかもそのうち来ちゃうんだ怖い
オープンソースのflux devは商用利用NGだからnovel aiみたいな企業は使えないよ

129 無念 Name としあき 24/08/23(金)11:53:58 ID:XKCgIWDI No.1248512017 そうだねx5
devは無料配布でクオリティ高いから原則商用禁止にしてるだけで
商用したいなら要相談みたいな事も書かれてるよ
まあNAIとかならわざわざdevじゃなくてproの方使うかもしれんけど

183 無念 Name としあき 24/08/23(金)13:46:48 ID:RfhsyH5c No.1248538192 そうだねx1
>aura flowてのは3060でまだついてそうなんかな
3060でcomfyUIで生成できたよ
速度は諦めて

185 無念 Name としあき 24/08/23(金)13:50:35 ID:XKCgIWDI No.1248538945 そうだねx2

1724388635598.jpg

auraflow0.3試したけどfluxdevfp8と速度変わらない
学習のしやすさとかはわからんけど出す絵のクオリティはうーんて感じ

87 無念 Name としあき 24/08/23(金)13:51:29 ID:XKCgIWDI No.1248539127 そうだねx3

1724388689908.jpg

アニメとかイラストとかのプロンプトが悪さしてるのかなと思って削ってもこんなの

192 無念 Name としあき 24/08/23(金)14:38:13 ID:RfhsyH5c No.1248548034
>auraflow0.3試したけどfluxdevfp8と速度変わらない
0.3より0.2の方が良い絵がでたよ
0.3は作者も納得行ってないみたいだし失敗かなと思う

69 無念 Name としあき 24/08/23(金)23:14:26 ID:7CFry3gI No.1248704223 そうだねx4
auraflowのモデルは17GBだと…
ドライブ空き容量的にずいぶん厳しい
A1111webuiは対応してくれるんだろうか

Fluxはちらほら使ってるとしあきがいるけど
auraflowはどんなモンなの?

125 無念 Name としあき 24/08/24(土)00:11:21 ID:cU5MEiWQ No.1248720484 そうだねx8

1724425881533.jpg

AuraFlowはこんな感じ 3060パワーリミット最大の3060で100秒ほど
FLUXと違ってネガティブ使っても極端に遅くならないのはいいけど手の破綻はFLUXよりずっと多くてSD3程度な印象

2024/8/23 NovelAI Diffusion V1モデルが公式に配布開始

NovelAI Diffusion V1 ウェイト公開のお知らせ
V1は2022/10に発表された初代の画像生成モデル。
現在NovelAIの画像生成で主流になっているのは、2023/11に発表されたV3。

  • Anime V1(キュレート版)
    健全版。健全絵を出力するならこちらの方が良いね、という声もある。
  • Anime V1(フル)
    エロもいける版。
  • Furry(ベータ版 V1.3)
    ケモナー向け。

 (参考) https://x.com/kiyoshi_shin/status/1826821097846964373

2024/8/23 (モデル)ebara_pony_3

https://huggingface.co/tsukihara/xl_model

(追記) 9/7頃、アカウントごと削除された模様。
凍結ではないので恐らくは作者自らによる削除と考えられるが、理由は不明。

人気のモデルシリーズの一つ。壺産。
Pony系列が普及したきっかけを作ったモデルの一つでもある。
 (関連) 4th tail

としあき達の反応

としあき達の反応

21 無念 Name としあき 24/08/23(金)18:25:55 ID:lYP.89nQ No.1248591760 del そうだねx7

1724405155714.jpg

>エバラさんがv3になってたよ
情報ありがたい
早速落としたのでペタリ

28 無念 Name としあき 24/08/23(金)18:40:52 ID:gjdEVLBc No.1248595525 そうだねx5

1724406052805.jpg

新しいebara中々いい感じじゃない?
個人的には4th tailって一番本家ポニーに近い派生モデルだと思ってたから嬉しい

35 無念 Name としあき 24/08/23(金)18:52:39 ID:gjdEVLBc No.1248598907 そうだねx2

1724406759506.jpg

ebara3の2.1からの一番大きい変更点は4th tailをmergeしたことでプロンプトである程度絵柄変えられるようになったことかな?

63 無念 Name としあき 24/08/23(金)19:34:53 ID:grjKe3hQ No.1248611387 そうだねx7

1724409293109.jpg

ebara3落としてみたー
huggingは速くていいですね!

9 無念 Name としあき 24/08/23(金)22:17:26 ID:FGsQPOA. No.1248681710 そうだねx6

1724419046871.jpg

たておつーエバラ3いいね
最初ガビガビになっちゃったけどプロンプト整理したら落ち着いてきた

87 無念 Name としあき 24/08/23(金)23:28:53 ID:oPPhHLzY No.1248708780 そうだねx7

1724423333028.jpg

たておつ
ebara3お試しバニーさん

2024/8/22 Midjourneyが無料お試し生成を再開

https://www.midjourney.com/

1つ目の記事タイトルにある通り、25枚まで。
また、この無料お試し生成はあくまで一時的に再開されたもの。気になる人は今のうちに試すほうがいいかも。

Midjourneyは古参の画像生成サービスの一つ。有料。
モデルはSD(Stable Diffusion)とは系統が異なる独自のもの。
2022/7にはオープンベータを開始しており、2022/8のSD1.0発表・公開より早い。

エロには厳しい。
が、特に健全・綺麗・可愛い系のイラストを生成する用途において、品質の高さに定評がある。
Pixiv等に利用者が多いかも。

主にDiscord上の公式鯖でbotに対してコマンド入力で利用する形。
しかし最近は公式Webサイト上でも利用可能になりつつある。下記参照。

モデルはバージョンアップが繰り返し行われており、現在の最新はv6.1。
過去のモデルや「にじジャーニー」用のモデル(二次元絵向け)も選択可能。
また6.2や7についても既に予告されている。

2024/8/20 (モデル)White Unicorn PVC

https://civitai.com/models/371840?modelVersionId=746116
人気のモデルシリーズの一つ。壺産。
たぶん気のせいだと思いますが、このモデルシリーズは年齢が低めの女の子にやや偏っているような気がしますね……。
ほか、ネガティブプロンプトに品質系のタグがたぶん不要、という特長もある。

今回はPVCフィギュアっぽい画風に特化したバージョン。

2024/8/17 自動モザイクツール(更新)

画像内の性器などを自動的に検出してモザイクをかけてくれるツール。
プロンプトなどの埋め込み情報(メタデータ)が保持される。
また、複数の画像ファイルを一度に投げて連続で処理させることも可能。

20 無念 Name としあき 24/08/17(土)15:26:01 ID:wsXLfUpk No.1246956013 そうだねx16

1723875961633.png

自動モザイクツールがエラーを吐いて手修正が必要になっていたので
いちおう修正しました
https://xgf.nu/T57Fx
numpy2.0対応バージョンにライブラリを更新
ちゃんと動くかわかりませんが詳しくはreadmeを

 (関連) よくある質問#埋め込み情報を残したままモザイク修正かける方法ないかな?

2024/8/15 AI絵 夏の国勢調査

お盆と言えば、そう、毎年恒例「AI絵環境アンケート」の季節です。皆知ってるね。知らない人は憶えてね。

実施の動機

  • 昔ヒでAI絵やってる人を対象としたアンケ(所持グラボとか)があったけど、あれからだいぶ経ったよね
  • NAIv1に比べv3はシェアを長く保っている気がする
  • 1111とForgeのユーザー比率はどんなもんだろ
  • たぶん今でも12GB民が一番多いけど他の比率はどれくらいかしら
    とか色々。

投票場所: Discordの🔞may避難所裏「AI絵総合」スレ
 8/15 18時~ 翌8/16 18時にかけて実施。
 また、mayの雑スレとエロスレで告知を行いました。
 ご参加いただいた皆様、ありがとうございました!

(2024/9/23追記)
9/22深夜に発生した「カリフォルニア事件」により、避難所「裏」の全てのスレとログが消失したため、投票結果についても現在は閲覧できなくなっています。

雑感、備考

雑感

  • 投票者数10~20人くらいと予想してたので少しおしっこちびりました。ありがとうございます。
  • NAIメイン民1割は概ね予想通り。サブツールとしての利用を含めたらもう少し多そう。
  • PixAI民や無料デモの民はもう少しいそうな気がしてた。
  • 1111と旧Forgeが拮抗してますねえ! 一長一短だしね。
  • 2月下旬に雑スレでとしあきブクマを走らせて集計した時は、1111が6割、Forgeが3割くらいでした。
  • ComfyUI民は、Civitaiのディスコ参加時に表示されるロール選択でも1割くらいいた気がする。
    とにかく新技術への対応が早いので根強い存在感がある。
  • 24GB民が15人も!? がああっ! パ、パワーが違いすぎる…
    踏み込んだ話、5%くらいと予想していたのに…
  • 11GB以下の人も2割くらいいますね。たぶんForgeの恩恵を受けてそう。それかSD1.5とか。
  • ハードウェア面については、wikiのPCスペックのページの執筆や、
    グラボ実売うんたらの活動をする上でも気になってる部分でした。

備考

  • あんまマルチポストで宣伝するのもウザくてヤだな……と思ったので、
    告知は雑スレとエロスレの2箇所に絞りました。
    その反面、宣伝場所が結果の傾向にも大なり小なりの影響を与えていそう……とも。
  • シンプルな単一選択式の投票にしたので、今回わかるのはあくまで「メイン」環境「メイン」ツールのみ。
    でも実際は、サブ環境・サブツールとして優れているものや、
    用途や状況による使い分けもあるし。次回は複数回答にするかも。
  • テレグラムは匿名制の投票機能もあり。
    WIKIWIKIの投票は自由記入あり(ユーザーが新しい投票項目を新設できる)など、
    それぞれ機能の差異がありますが、今回はひとまずディスコの避難所裏で実施しました。
    この辺はユーザー数、不正投票対策、閲覧性などで一長一短なので悩ましいところ……。
  • 愛用している拡張機能の情報とかも有益そう。
  • 他の人が突発でアンケ実施してくれても全然構わないので、お気兼ねなく!

2024/8/15 (モデル)FLUX.1 [dev] GGUF

  • [dev]NF4_v2 に比べ少し結果(プロンプトへの追従性)が良好かも?(故人の感想にごつ)
  • 画像生成の所要時間は3割増しくらい(筆者の4070環境では)

ComfyUIでのGGUFの話はこちら
https://github.com/city96/ComfyUI-GGUF

以下、Forge 2.0でGGUF版FLUX.1モデルを試したい人向けメモ

1723795664364.png
こんな感じに設定してできあがり

2024/8/14 (モデル)JitQ pony

https://civitai.com/models/132246?modelVersionId=718280
SD1.5時代、ジト目と可愛らしい絵柄によりとしあき達に好評だったモデル。そのPony版。

93 無念 Name としあき 24/08/14(水)09:06:51 ID:3PNcchpM No.1245978357 そうだねx8

1723594011551.png

たておつ
JitQのポニーバージョンがきてるぞー!

189 無念 Name としあき 24/08/14(水)11:25:18 ID:oFSurbFU No.1246007665 そうだねx4

1723602318287.jpg

>JitQのポニーバージョンがきてるぞー!
JitQいいね
情報ありがとう

26 無念 Name としあき 24/08/17(土)02:25:51 ID:pBR9wJQY No.1246839321 そうだねx14

1723829151684.png

たておつニュースではなんか朝まで荒れるみたいなこと言ってたけどもうすっかり静かだな…
少し前にスレで紹介されていたJitQを試してみたけどなるほどジト目がステキなモデルだ

おやすみ…

28 無念 Name としあき 24/08/17(土)02:41:54 ID:vWhlFaWs No.1246840762 そうだねx10

1723830114313.png

JitQ良いよね

2024/8/14 X(旧Twitter)に画像生成機能が追加(980円~/月)

https://x.ai/blog/grok-2
Xには以前から(日本では2024/5/8から)GrokというチャットAI機能があった(有料)。
今回それがGrok-2にバージョンアップされるとともに、チャットを通しての画像生成の指示にも対応した。
画像生成にはFLUX.1が利用されている。ただしモデルの詳細については不明。

  • 日本語での指示にも対応
  • プロンプトは500文字まで。以降切り捨て
  • 画像解像度は1024x768固定
  • プランにより時間あたりの利用回数制限が異なる

Xのサブスクには3段階ある。

プランベーシックプレミアムプレミアムプラス
費用368円/月980円/月1,960円/月
画像生成-利用可利用可
制限-2時間に20回までなし?(未確認)
  • 課金方法(ブラウザ経由、iOSアプリ経由、泥アプリ経由)により価格設定が異なる
    (たぶん林檎ストアとGoogleストアのマージンの影響)
  • 月単位の他、年単位のプランもあり、少し割安になる
  • 画像生成以外にも、プランによって多数の機能差がある

日本語記事

2024/8/13 Googleが画像生成AI「Imagen 3」を一般公開

https://deepmind.google/technologies/imagen-3/
それまでベータテスト中だったImagen 3が、広く一般にも公開された。
利用にはGoogleアカウントによるサインインが必要。

問題は内容の制限で、こりゃ厳しい!
厳しいなんてもんじゃない、ゲロゲロに厳しい。ゲロ犬どころの騒ぎではない。
"Illustration of a girl eating ramen" ですら0/4(4枚総ボツ)なので、ちょっとやそっとじゃ済まない。

通りさえすればなかなか良好な品質の画像が出てくるのだが……。
1723813292520.jpg image_fx_.jpg image_fx_ 2.jpg

(5/15) ASCII.jp: グーグル、新しい画像生成AI「Imagen 3」発表 かなりキレイで文字入れもOK
(8/16) ASCII.jp: グーグルが自賛する画像生成AI「Imagen 3」、制限が厳しすぎとの声
(8/30) ASCII.jp: 「リアルすぎる」と話題 グーグル画像生成AI「ImageFX」の使い方

2024/8/11 Forgeが2.0になり、FLUX.1に対応

https://github.com/lllyasviel/stable-diffusion-webui-forge

(8/14追記) Readmeから「工事中」の段落が削除された。
イリヤちゃんが計画していたForge夏の大改造はひとまず完了した、と考えられる。
ただ今後も小規模な機能追加や改良、不具合修正などはあるかもしれない。

なおGradio 4等の影響により動作に問題が報告されている基本機能や拡張機能も少なくない。
手元に旧Forge(v1.8.0ベース)環境があるユーザーは、git pullを避けてそのまま温存し、
別ディレクトリに最新版のForge環境を新たに構築するのが良いだろう。
後述するEasyForgeも、オススメできる方法の一つ。

Forge 2.0の特徴

  • SDXLで遊ぶ時は、左上の「UI」を「xl」に切り替えよう。
  • [Major Update] BitsandBytes Guidelines and Flux #981
    ↑新機能や操作方法などの説明も含んでいるので、ぜひ一読してほしい。
    ざっくり言うと、FLUX.1に対応。NF4にも対応した。FP8より遥かにコンパクト。
    おかげでVRAMを節約できるし、VRAMがメインメモリに溢れにくくなるから時間短縮にもなる。
    とはいえ、画像生成の所要時間は1枚毎のぶれ幅が結構大きい気もする。
  • Major Update #1: Gradio 4 Engine #853
    Inpaint等のキャンバス機能が刷新された。
  • Major Update #2: LayerDiffuse Transparent Image Editing #854
    LayerDiffuseの透過機能がInpaintにも対応した。
    ゲーム素材やカスタムポートレートの作成がより捗りそう。
  • ほか、以前にも書いたように、1111のv1.10.1がベースになっている。
    なのでLoRAリストのボタン式表示や、DoRA対応なども含まれている。

悪い知らせもある。

EasyForge

https://github.com/Zuntan03/EasyForge
安全・お手軽にForge 2.0環境を新規構築できるバッチファイル。筆者も利用してますありがとうございます。
該当や操作手順は、Readmeに日本語で書いてある通り。

チコッと補足

チコッと補足
バッチの実行時にこんな感じで
EasyForge.png
Forge.batと同じ階層に沢山のファイルやフォルダがバーッと作成される。
なのであらかじめ「EasyForge」なり何なり、新しいフォルダを作って
その中にForge.batを置いてから実行すると良いと思うぜ!

旧Forge(v1.8.0ベース)に戻したい時

うっかり更新しちゃったとかの事情で
f0.0.17v1.8.0rc-previous (2024/6/28) [bfee03d8] に戻したい時の話。

2024/8/7 ComfyUIFLUX.1に対応

新型モデルであるFLUX.1が、ComfyUI最新版で使用できるようになった。
リリース情報:https://github.com/comfyanonymous/ComfyUI/releases/tag/v0.0.4

余談:

  • ComfyUIは7月から週に一度(基本的には金曜日)、Releasesのページにて安定版を公開する方針となっている*1。これに伴い、安定版に対してバージョン数字も付与されている(例: v0.0.4)。
    • 一方、masterブランチはほぼ毎日更新されるナイトリービルド。常に最新の内容である反面、タイミングによっては新しい問題を抱えている場合もある。
      masterブランチでは8/1からFLUX.1への対応作業が開始されていた。
  • ちなみに、sd-scriptsにおいては、7月末にSD3対応の開発が進められていたが、FLUX.1の唐突なリリースとその期待値の高さから、SD3学習環境のリリースを一時中断し(または並行で)FLUX.1の環境整備が始まっている。

    (参考)GitHub - sd-scripts内での会話:https://github.com/kohya-ss/sd-scripts/issues/1445

2024/8/3 グラボ実売価格・8月

月1で調査しています。

  • (8/5) 1㌦141円!! とはいえグラボの市場価格へ好影響をもたらすのは、ある程度の期間(例えば1ヶ月とか)持続した場合の話になるだろう。
    • この円高はNovelAIのサブスク費用を安価に抑えるチャンスでもある。今は時期が良い!
  • 3060がまもなく生産終了との情報あり
    • それとは別に、3060(12GB)搭載のBTOモデルも2024年上半期の内にだいぶ減ってしまった。
      このため、BTOで新規にPC本体を購入する人には3060 12GBをおすすめしづらくなっている。
  • ForgeはVRAMの自動的な管理と省VRAM性が特長だが、現在の安定版は3月のv1.8.0ベースで止まっている。
    1111は7/27にv1.10に更新されたが、必要VRAM量はForgeより多い。
    • ここのコメ欄にもあるように、この機にForgeから1111に戻るのなら、必要VRAM量が増すことになる。
    • Forgeから1111に戻った際、VRAM不足による速度低下やoomに遭遇する報告をちょいちょい見かける(ひろばのコメントにもある)。筆者もSDXL 1024x1024のHires.fix x1.5でたまに遭遇する。もちろん使い方によるが、足りたり足りなかったりという感じかも。
    • 主にVRAM面での理由から、旧Forgeを使い続けるユーザーもいる。
      (他に「UIや機能面で現状困ってないから積極的に更新や移行するほどでもない」というケースもある)
  • GeForceの5000番台はまだ噂レベルの情報ばかり。

各GPUの速度比を算出するにあたって、やかもち先生の下記記事から描写時間(所要時間)の値をお借りしました。
【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】 | ちもろぐ
値をお借りしたグラフ: 1024 x 1536 Ayaka LoRA + SDXL Benchmark

GPUVRAM速度比*2TGP*3前回(7/4)今回(8/3)寸評
306012GB100%170W¥40,980¥41,980VRAM・速度・価格のバランスが良い。
ローカルAI絵入門者向けのド定番。
8GB版も存在するので、誤って購入しないよう注意。
4060Ti16GB150%165W¥69,980¥69,800比較的多めのVRAMが特長。
407012GB200%200W¥85,980¥86,680カード長270mm未満・8ピンx1の製品が多いため、
1000番台・2000番台からの移行がしやすい。
4070S12GB221%220W¥96,980¥96,800カード長270mm未満・16ピンx1の製品が多い。
ワッパ*4に優れるのも特長。
4070Ti12GB240%285W¥107,980¥104,980終売予定。カード長300mm以上・
16ピンx1の製品が多い点に注意。
4070TiS16GB265%285W¥128,700¥128,700
408016GB340%320W¥159,799¥159,500終売予定。……なのだが息が長い。
4080S16GB353%320W¥162,000¥162,0004080無印との速度差はごく僅か
409024GB516%450W¥287,000¥291,4807/31に確認した時点ではいつも通り¥279,800だった。
29万に上がったのは、(たぶん一時的な)品切れによる繰り上がり。

その他
AI用に新規購入するのはおすすめしないグラボたち。
VRAM量、速度、導入・運用の手間など、それぞれ理由が異なる。
ただしここに挙げられていても、既に所持している分は、しばらく活用するのも良いだろう。

  • GeForce
    3050, 3060(8GB), 4060, 4060Ti(8GB)など。
    VRAM 8GBのグラボを今からAI絵用に購入するのはおすすめできない。
  • Radeon:
    現状ではLinux(Ubuntu等)上でROCmを使用するのが高速だが、それでも速度/価格比ではGeForce系に若干及ばない。
    しかし最近はzludaを使用してWindowsでもROCmが動くバージョンが出てきているので、Windowsにおける速度面のハンデは減りつつある。
  • Intel Arc A770:
    8GB版と16GBがある。SD.nextなどoneAPI版の1111を利用する必要があるため、初心者向けではない。

2024/8/2 NovelAIにディレクターツールが追加

NovelAI Director Tools Update (JP)
NovelAI_Director_Tools.webp

mayの雑スレでも多少話題に上がった他、単独スレも1000完走。
NAIの新機能が剥ぎコラツールすぎてヤバい (ふたばフォレスト: 3日間有効)

Discord「避難所裏」の「NovelAIスレ」や
テレグラム「裏の裏」の「NovelAIスレ」などでも
これらNAIの新機能について語られている。

2024/8/1 Forgeが大規模な更新作業に突入

Readmeの「Under Construction」の項を参照。

日本語訳

工事中
WebUI Forgeは現在、2024年8月1日から8月7日までの1週間にわたって大幅な改訂が行われます。テストに参加するには、最新の不安定バージョンに更新するだけです。
現在の進捗状況(2024年8月3日):バックエンドの書き換えは81%完了しました。安定稼働を開始するには残り30時間、多くの新機能のサポートを開始するには残り48時間です。

  • 今は動作がすげー不安定なバージョンなので、ぎっぷるは避けよう。
  • 予定では8/7、もしくはそれ以降には、安定性を取り戻したバージョンにお目にかかれるかも。

2024/8/1 (モデル)FLUX.1

概要

(8/1) BFL(Black Forest Labs)からの公式発表
Announcing Black Forest Labs - Black Forest Labs

(8/2) ASCII.jp:「Stable Diffusion」開発者たちが新たな画像生成AI「FLUX.1」を発表 迷走するStability AIと対照的な展開に
(8/19) ASCII.jp:「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」

二次元美少女は多少出るが、品質にはあまり期待できない。
プロンプトの内容をAIが理解してくれる度合いはCopilot(旧Bing)と同じくらい?
健全絵の構図やポーズ元としてimg2imgに利用するのも手。

エロは出ない 乳首は出るけど女性器・男性器は出ない。
派生モデルやLoRAが少しずつ出始めている(8/13)のでそちらに期待しよう。

8/13現在、ローカル環境ではForge 2.0、ComfyUISwarmUIなどが対応済み

デモ

いずれも登録不要、無料。
https://huggingface.co/spaces/black-forest-labs/FLUX.1-dev
https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell
https://huggingface.co/spaces/multimodalart/FLUX.1-merged
残念ながらメタデータは残らない様子。

ほか、Hugging Spacesにて探すといいかも。

(8/13追記) Forge 2.0とNF4版モデルによって状況が大きく変化したため、ここから下は旧情報。
今からローカル環境で始めるならForge 2.0を新規ディレクトリに構築するのがおすすめ。
手持ちの旧Forgeを最新版にぎっぷるするのはおすすめしない。
Gradio 4の影響で正常に動作しなくなってしまう拡張機能が少なくないからだ。

ローカル環境へのモデル導入方法など

ComfyUIの環境構築

方法は色々あるはずだが、筆者があんま詳しくないのでざっくりした説明で。

  • 安定版であるv0.0.4の.7z (1.47GB)をDLして解凍
    ポータブル版なのでたぶんお手軽だと思います。
  • Stablity Matrix経由で導入
    これもGUI上の操作(つまりマウス操作)で済むので、お手軽な方法の一つ。
    • 他の方法で構築した環境をStablity Matrixにインポートしても良い。
      構築した環境をStablity MatrixのPackagesフォルダの中に移動すれば、Stablity MatrixのUIに認識されるので、インポートを実行可能になる。

モデル等の導入方法

こちらの記事ではFP16版モデルを使用しているが、参考になる部分も多い。
(8/7) ASCII.jp:画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した

  • ただし通常(=FP16版)の[dev]モデルのDLにはHugging Faceアカウントが必要となる。
  • 文中ではVAEのファイル名が「ae.sft」となっているが、こちらは8/6に「ae.safetensors」にリネームされた。

モデル(どれか任意の一つでもOK)

VAE

TE(テキストエンコーダ)

使い方

サンプルworkflow
https://comfyanonymous.github.io/ComfyUI_examples/flux/
下にスクロールするとFP8版モデル用のサンプルworkflowもある。

サンプル画像内にworkflowの情報がメタデータとして残されている。
画像を一旦保存した後、ComfyUIのworkflowの画面にドラッグ&ドロップで投げ込めば良い。

2024/7

2024/7/28 Forgeが更新されv1.10.1ベースになった

https://github.com/lllyasviel/stable-diffusion-webui-forge

前回

1111のv1.10.1に概ね準拠した内容になった。

  • LoRAリストの表示をツリー式とボタン式から選択可能になった。
    Extra Networks directory view style
    Settings左上の検索欄に「View」とでも入れて検索すると良い。
    extra_networks_tree_view_style.png
  • しかしSD3にはまだ対応していないっぽい?
  • なんかPNG Infoの挙動とかちょっとおかしいかも……。
  • 拡張機能forge-coupleが動作しない
    情報元

    15 無念 Name としあき 24/07/28(日)05:51:34 ID:ozYKVAxU No.1241134143 そうだねx1

    >No.1241133614
    情報ありがとう
    こっちは確認したところ
    forge-couple
    (https://github.com/Haoming02/sd-forge-couple)が動かないのと
    なんか全体的に動作がもっさりしてる感じがする

    その後、forge-coupleがアプデによりGradio 4に対応したため、現在はこの問題は解決されている。
  • 他にも正常に動作しない機能や拡張機能が多数存在するであろうことは想像に難くない。

まあ、イリヤちゃんがこれまで何度か言ってきた通りなのである。

要約

  • 今後のForgeは、より実験的な内容のリポジトリになるよ。
    大きな変更が加わることで、従来動いていた機能や拡張機能が正常に動作しなくなる恐れがある。
  • これまでForgeを愛用していたユーザーは、手持ちのバージョンのまま環境を温存するか、
    もしくは1111への移行がおすすめだよ。

旧Forge(v1.8.0ベース)に戻したい時

うっかり更新しちゃったとかの事情で
f0.0.17v1.8.0rc-previous (2024/6/28) [bfee03d8] に戻したい時の話。

2024/7/27 (1111)v1.10.0、v1.10.1

https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.10.0

v1.10.0のRC(Release Canditate、リリース候補版)が外れ、正式版がリリースされた。
v1.10.0-RCよりも後で変更された箇所についてはこちらを参照。Betaスケジューラの追加とか。

ちなみに前バージョンであるv1.9.4のリリース日は5/29
v1.9.0の正式リリースは4/13だった。

ざっくり

  • 画像生成速度がForgeと同等か少し速いくらいに向上
    • 起動オプションに--precision halfを書き加える必要あり
  • SD3に対応
  • 新しいスケジューラを6種類追加(DDIM等)
  • 新しいサンプラー(DDIM CFG++)を追加

ここでは主な内容を抜粋して紹介する。全ての内容を確認したい人は前述のURLを開き、右クリックで日本語に翻訳して読んでほしい。

もっと見る
  • 画像生成速度の向上
    起動オプションに--precision halfを書き足すことで5~10%程度高速になる。
    これによりForgeと同等か少し速いくらいの速度になる、なった。
    precision_half.png
    --precision halfを足さない限りは従来通りの1111の速度のまま。
    起動オプションなしの1111はかなり遅いので、--xformersまたはsdp系と
    --precision halfを併用するのが現実的な運用になるだろう。
    • 一方でVRAM的には依然としてForgeの方に優位性がある。
      1111でも--medvramを利用すればForge並の省VRAM性を得られるのだが、
      速度は20~25%程度落ちてしまう。
      しかしForgeはご存知の通り3月のv1.8.0ベースのまま更新が止まっているので、
      LoRAリストの表示はツリーのON/OFFのみ。
      1111ならツリー式とボタン式をSettingsにて選択可能。などといった違いもある。
  • SD3に対応 (#16030)
    1111のデフォルトではT5が無効化されているためVRAMは7GBくらいしか使わない。
    8GB環境でもギリいけるのかも。--medvramを使えばまずいけそう。
    T5を有効化すると12GBでもoomエラーを吐くが、--medvramの利用により解決できた。
    長いので折り畳み
    • おすすめモデルはお約4GBのSD3 Medium [cc236278d2] 。
      ホーチミンおじさん達により1111での動作確認が済んでいる。
      Hugging Faceでも配布されているが、HF垢でのログインと、ライセンスへの同意が必要。
    • 1111でモデルをSD3 Mediumに切り替えると何か勝手にDLが始まる。
      ・clip_g.safetensors (1.28GB)
      ・clip_l.safetensors (235MB)
      これらはHugging FaceのAUTOMATIC垢からDLされ
      models\CLIP に配置される。
    • 推奨プロンプトやネガティブはよくわからないが
      一例としてstep15~30, Euler, CFG 5~7, 1024x1024で一応形にはなるようだ(可愛くはない)
    • T5を有効にして1111を再起動すると、何かクソデカファイルのDLが自動的に開始される
      ・t5xxl_fp16.safetensors (9.12GB)
      これも models\CLIP に突っ込まれる
      こんなデケーもんを読み込んだらVRAMが不足するに決まってるだろうがよえーーっ
      oomエラーを吐き続けるので1111を一旦終了し、--medvramを付けて起動しよう
      VRAM 20GB以上あるタイプの富豪あきなら素のままでも足りるのかもしれない
      T5の有効化により生成結果が良くなる……かどうかはまだちょっとわからない
      ある程度異なる結果になることは筆者の手元で確認できている
      (しかしどちらにしても可愛くはない)
    • 備考
      • 75トークン以上もいける
      • T5の有効/無効はメタデータやinfotextに記載されない
      • 拡張機能Adetailerは動作と効果を確認できた
  • 新しいスケジューラを6種類追加
    • Align Your Steps (#15751)
    • KL Optimal (#15608)
    • Normal (#16149)
    • DDIM (#16149)
    • Simple (#16142)
    • Beta (#16235)
      それぞれ元のPR(プルリクエスト)に特徴の説明とサンプル画像がある。
      Normal、DDIM、Simpleの3種はComfyUIからの移植。
      「DDIMって前からあったよね?」と思うかもしれないが、それはサンプラーの方。
      今回追加されたDDIMはスケジューラ。
  • 新しいサンプラー(DDIM CFG++)を追加 (#16035)
  • 初期のステップでCFGをスキップするオプションを追加 (#15607)
    Ignore negative prompt during early sampling (デフォルト0)
    skip_early_cond.webp
    上から0、0.1、0.2。使用モデルはebara_pony_2.1。
    X/Y/Z plotには該当項目がまだ存在していない様子なので、手動で画像を連結した。
    例えば10stepに対して0.2を指定すると、1~2ステップ目でCFGがスキップされる。
    これは単純に生成時間の短縮に繋がる。手元で確認した限りでは0.1につき4%くらい?
    また元のPRによれば「場合によっては収束も早くなる」とのこと。
    つまり省ステップ化、あるいは同じステップ数でより高品質な結果を得られる。
    上記のカプチーノちゃんの例を見ると、顔の描写が前倒しで始まっている……気がしなくもない。
    でも生成結果がだいぶ変わっちゃうんですけど
    メタデータやinfotextには「Skip Early CFG:」として記載される。
    • NGMS(Negative Guidance Minimum Sigma)とはちょっとだけ似ているが別物。
  • --models-dirオプションを追加 (#15742)
  • SDXL系列モデルにCLIP Lを適用するオプションを追加 (#15992)
    ☐ Clip skip SDXL (デフォルトOFF)
  • 画像生成中に画面がスリープ状態にならないようにするオプションを追加 (#16001)
    ☑ Prevent screen sleep during generation (デフォルトON)
    意外と今までなかったんだなあ。
  • LivePreviewのON/OFFを切り替えるボタンを画像ビューアに追加 (#16065)
    ボタンの位置がちょっとわかりづらいので、元のPRにある動画を観ることをオススメする。

v1.10.1

なんかv1.10.0の9時間後くらいに来た。
今んとこリリースページには記載がないが、changelogには加筆されている。
git pullするとv1.10.1になる、なった。

  • CPUで画像のアップスケール処理に失敗する問題を修正 (#16275)

2024/7/23 CivitaiのSD3のBANが解除

SD3 Unbanned: Community Decision on Its Future at Civitai

前回までのあらすじ

  • 2024/6/12 Stable Diffusion 3 リリース
  • 2024/6/18 CivitaiのSD3が暫定的に非公開にされた
  • 2024/6/22 CivitaiにおけるSD3の取り扱い続報
  • 2024/6/25 Stability AI社の経営者交代が発表
  • 2024/7/5 SD3のライセンスが更新
  • 2024/7/10 Civitai創設者からコメントあり*5
    「私たちはStabilityと話し合いを行っており、近日中に最新情報を共有する予定です。」
  • 2024/7/23 CivitaiのSD3のBANが解除 ←今ココ

ちなみにTLDRは"Too long. Didn't read"の略。今北産業的な要約のこと。
SD3のライセンス更新から結構間が空いたが、その間もCivitaiとSAI社の間で話し合いが続いていた様子。
完全な円満解決……とまでは言えないようだが、ひとまず無事に落着し、CivitaiにおけるBANも解除された。

というわけでCivitaiにおけるSD3モデルの配布ページはこちら。
Stable Diffusion 3 (SD3)
ローカル環境でSD3に対応しているのは、ComfyUIと、1111のv1.10.0以降。

  • ComfyUI用のWorkflowが公開されているので、ComfyUI民の人はそちらをどうぞ。
    また、ユーザーによる生成画像にもメタデータとしてWorkflowが埋め込まれている物が多い。

2024/7/15 PixAIで未成年規制が強化されたが、翌日撤回

画像生成時、プロンプト内容に対して機械的な自動検出による規制が実装された。
例えばloliやflat chestなどのように未成年や児童を示す文字列が含まれていると、画像生成を実行しようとした際、即座に阻止される。この時、規制に該当した単語が明示される(されないこともある?*6)。

主な特徴

  • 生成した画像の公開/非公開に関係なく、画像の生成自体に対して規制が実施された。
    自分だけでひっそりと生成して遊ぶだけの人も許されない。厳しい措置である。
  • 未成年系の単語に関しては、実写風、2.5次元(セミリアル)、二次元を問わず、一律に規制された。
    実写風のみならず二次元でもアウトということである。「Civitai並に厳しくなった」とも言える。
  • 未成年系の単語規制に複数回連続で該当すると、「次に引っかかったらキミの公開コンテンツを人工的な再審査に送るからね」的な内容のポップアップが表示される。
    つまり公開中の画像、モデル、LoRA等が、(機械による)再審査を受けることになる。
    これはトライ&エラーによって規制を掻い潜ろうとするイタチごっこを避けるため。
  • 元々エロ規制が厳しかったスマホアプリ版だけでなく、PCブラウザ版に対してもこれらの規制強化が実施された。

こうした大幅な規制強化を受けて、各所でロリコンどもの悲鳴が上がった(俺も上げた)
いやまあロリコンに限らずおねショタ民、実写風モデル愛好民、その他一般的なPixAI民の多数に影響が及んだ。
サブスク解除、他の画像生成サービスへの移行、ローカル環境構築、LoRAの利用、特化モデルの利用など、各ユーザーが対応を模索することになった。

しかし翌7/16、撤回が表明されたことで事態は急速に沈静化。
全国1億2000万人のロリコンどももひとまずは大人しくなった。
ただし、

  • 18歳未満のアカウントにおいては、プロンプト内にエロ単語を使用できない。
    これは最近7/3から実施された措置
    https://pixai.art/profile/edit/misc
    この辺の設定で「私は18歳以上です」がONになっているか、確認しておこう。
  • また、実写系およびセミリアル系モデル利用時におけるエロワード規制は引き続き実施されており、注意が必要。
    この辺は実在人物のフェイク画像問題に関する措置かもしれない(想像です)。

余談: PixAIにおけるエロ規制の経緯(雑な抜粋)
「AI絵界隈自体がまだ2年程度で歴史が浅い」という要因もあるためか、規制内容は度々調整されている。
PixAIに限らずCivitaiやCopilot(旧称Bing)等でも同様。

  • 2023/10
    月初から月末にかけて、大規模な規制強化と再調整が実施された。
    林檎やGoogleなどのスマホアプリプラットフォームとの兼ね合い?
    なお「loli」がNGワードになった際、「gothic lolita」まで巻き添えを受けた。他にも同様の例がいくつかあったため再調整が入った。
  • 2023/12/20
    この辺でもプロンプトフィルターの調整が入った模様。
  • 2024/1/12
    実写風モデル利用時のエロワード規制はたぶんこの辺から。

2024/7/7 Forgeと最新の1111を掛け合わせたフォーク版が公開

(7/12) 本家Forgeと区別しやすくするため、「reForge」という名前に変更された。

https://github.com/Panchovix/stable-diffusion-webui-reForge
Forgeのdev2ブランチをベースに、1111のv1.10.0-RCの内容をマージしたもの。

フォークしたPanchovix氏自身によるRedditのスレが詳しい。

Forgeの速度と省VRAM性に、1111 v1.10.0-RCのUIと機能。光と闇が両方そなわり最強に見える
サンプラーやスケジューラの追加」
「ForgeでLoRAを使用する際、稀にoomエラーを吐いてた問題が修正された」
などの改善が行われている。
一方でSoft Inpainting、SD3、LoRAリストのボタン式表示など、技術的に難しいため1111からマージできなかった、あるいは正常に動作しない機能もある。
またRedditのコメ欄によると、ControlNetの利用に問題があるようだ。

導入方法

(A) WindowsにGitとPythonをインストール済みの場合
任意のフォルダにて右クリックから「ターミナルで開く」を選び

git clone https://github.com/Panchovix/stable-diffusion-webui-reForge reForge

で新規に環境を構築できた。末尾の「reForge」は新規に作成するフォルダ名なので好きに命名して構わない。

(B) WindowsにGitとPythonをインストールしてない人

折り畳み
  1. まずは1111 v1.0.0-preのzip (50MB)をDLする。GitとPythonの簡易版が同梱されているからだ。
  2. 任意のフォルダに解凍。ついでにフォルダ名も変更。
  3. update.batの中身を下記の通りに書き換えて上書き保存。
    @echo off
    
    call environment.bat
    
    git -C "%~dp0webui" remote add reForge https://github.com/Panchovix/stable-diffusion-webui-reForge
    git -C "%~dp0webui" fetch reForge
    git -C "%~dp0webui" switch -c main reForge/main
    
    git -C "%~dp0webui" pull 2>NUL
    if %ERRORLEVEL% == 0 goto :done
    
    git -C "%~dp0webui" reset --hard
    git -C "%~dp0webui" pull
    
    :done
    pause
    編集内容を説明すると、「call environment.bat」の後に3行加筆している。
    この3行でPanchovix氏の「dev_upstream_a1111」ブランチへの切替を指示しているわけだ。
  4. update.batを実行。
    「続行するには何かキーを押してください . . .」と表示されるので、何かキーを押す。
    自動的にウィンドウが閉じられる。
  5. このタイミングで、webui\models フォルダをシンボリックリンクで他の環境と共有すると良い。
    この後(6)でForgeの初回起動を行うわけだが、
    その際に webui\models\Stable-diffusion が空っぽだと、
    サンプルモデルとしてrealisticVisionV51_v51VAE.safetensors (1.99GB)が
    勝手にDLされてしまうからだ。
  6. run.batを実行。初回は動作に必要なライブラリが色々と自動DLされるので数分かかる。
    以上で導入は完了。次回以降は(1)~(5)をすっ飛ばしてrun.batで起動するだけだ。
    起動オプションはwebui\webui-user.bat に記入。

起動オプション

ベースがForgeなので起動オプションは未指定でも構わないが、Panchovix氏によれば
NVIDIAのグラボを使っている場合は

--cuda-malloc --cuda-stream

がオススメ。
(参考) reForgeの起動オプションの説明

備考

起動時に「ModuleNotFoundError: No module named 'diffusers'」エラーが表示される場合

起動時に「ModuleNotFoundError: No module named 'diffusers'」エラーが表示される場合

8 無念 Name としあき 24/07/09(火)18:41:04 ID:hSZblFVI No.1236044407 そうだねx5

1720518064165.jpg

たておつ
昨日スレにあったForgeと最新の1111を掛け合わせたフォーク版だけど、
としwikiを参考に別環境にインストール出来たが起動時エラーMSGが出る・・・
おま環かバグかわからないが、とりあえずツールフォルダにある
requirements_versions.txtに、diffusers==0.25.0 を追記すれば
出なくなったがこれが正しいのかは不知火。
(ちなみに0.25.0てのはうちのforgeに書かれてたver。)

2024/7/5 SD3のライセンスが更新

ライセンスアップデート
だいぶ具体的かつ明確になった。と思いますたぶん(素人のレス)。

SD3に元々関連していた商用ライセンスがコミュニティに混乱や懸念を引き起こしたことを認識しているため、

という一文が含まれている。

SAI社の経営者交代

6/22の話題(CivitaiにおけるSD3の取り扱い続報)でも触れたが、SAI社のリーダーシップ変更についてCivitaiが期待を寄せている旨の発言があった。

私たちは引き続き連絡を取り合っており、最近のリーダーシップの変更のニュースにより、話し合う機会が得られると楽観しています。

その後6/25にSAI社の経営者交代が発表された。
Civitaiちゃんの見立て通り、これがライセンス問題の解決に良い影響を与えたと考えられる。

Civitai運営からの反応

7/7現在ではCivitaiちゃんからの反応はまだなく、6/18に実施された暫定Banが続いている。
ちなみにCivitaiにおけるSD3モデルの配布ページはこちら

このモデルはアーカイブされており、ダウンロードできません。

と書かれている通りである。
しかしまあ、今回のライセンス更新を受けて、数日以内に何らかの進展があるだろう。

Pony作者からの反応も気になるところ。
6/12の時点では
「SD3は商用ライセンスの説明がアレだから、ひとまずSDXLをベースにしてPony V6.9を作るわ……」
「SD3をベースにしたPony V7は、商用ライセンスの条件次第かなー」的な話だった。
普通に考えればこのままV6.9を優先しつつ、その後V7……という流れになると考えられるが、
今回のSAI社からの発表を受けて何かが変わるかもしれない。

今後のSD3

SAI社からの発表内容に戻ると、

継続的な改善:SD3 Mediumはまだ進行中の作業です。
数週間以内に大幅に改善されたバージョンをリリースする予定です。

とある。

2024/7/4 グラボ実売価格・7月

月1で調査しています。

  • 円安の影響か、あまりパッとしない月が続く。
    急激に跳ね上がったわけではないが、じわじわと影響が出ているように見える。
  • 6月末にZLUDA導入方法のページを書いてくれたとしあきがいるよ。Radeonの民向け。

各GPUの速度比を算出するにあたって、やかもち先生の下記記事から描写時間(所要時間)の値をお借りしました。
【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】 | ちもろぐ
値をお借りしたグラフ: 1024 x 1536 Ayaka LoRA + SDXL Benchmark

GPUVRAM速度比*7TGP*8前回(6/9)今回(7/4)寸評
306012GB100%170W¥42,620¥40,980ローカルAI絵入門者向けのド定番。
VRAM・速度・価格のバランスが良い。
8GB版も存在するので、誤って購入しないよう注意。
4060Ti16GB150%165W¥69,980¥69,980比較的多めのVRAMが特長。
407012GB200%200W¥84,799¥85,980カード長270mm未満・8ピンx1の製品が多いため、
1000番台・2000番台からの移行がしやすい。
4070S12GB221%220W¥94,800¥96,980カード長270mm未満・16ピンx1の製品が多い。
ワッパ*9に優れるのも特長。
4070Ti12GB240%285W¥104,980¥107,980終売予定。カード長300mm以上・
16ピンx1の製品が多い点に注意。
4070TiS16GB265%285W¥128,700¥128,700
408016GB340%320W¥163,152¥159,799終売予定。……なのだが息が長い。
4080S16GB353%320W¥163,980¥162,0004080無印との速度差はごく僅か
409024GB516%450W¥279,800¥287,000久しぶりに28万から上がった。
理由は単に(たぶん一時的な)品切れによる繰り上がり。

その他
AI用に新規購入するのはおすすめしないグラボたち。
VRAM量、速度、導入・運用の手間など、それぞれ理由が異なる。
ただしここに挙げられていても、既に所持している分は、しばらく活用するのも良いだろう。

  • GeForce
    3050, 3060(8GB), 4060, 4060Ti(8GB)など。
    VRAM 8GBのグラボを今からAI絵用に購入するのはおすすめできない。
  • Radeon:
    現状ではLinux(Ubuntu等)上でROCmを使用するのが高速だが、それでも速度/価格比ではGeForce系に若干及ばない。
    しかし最近はzludaを使用してWindowsでもROCmが動くバージョンが出てきているので、Windowsにおける速度面のハンデは減りつつある。
  • Intel Arc A770:
    8GB版と16GBがある。SD.nextなどoneAPI版の1111を利用する必要があるため、初心者向けではない。

2024/6

2024/6/26 Open Model Initiativeが発足

AI四天王(※5人以上居る)が集まってオープンソースモデルを作るぜ!ということ。
画像生成だけでなく、動画や音声用のモデルも対象。
直接的な言及はないが、先日のSD3、特にそのライセンスの件が大なり小なり影響していそう(※筆者の想像です)。

イカれたメンバーを紹介するぜ!

続報ではさらに

  • みんな大好きPonyの作者、兼PurpleSmartAIの創設者
  • SD.Nextの作者であるvladmandic
    2023/4頃、1111の開発が1ヶ月くらい停止しており、
    vladmandic氏によるフォーク版(いわゆるvladmandic版)への関心が強まったことがあった。
    現在は「SD.Next」という名前で呼ばれている。

など、多数の協力者が発表されている。

2024/6/22 CivitaiにおけるSD3の取り扱い続報

6/18の件の続き。
Update on SD3 on Civitai

一言でいうと、しばらく駄目っぽい。
残念ながら現在の見通しは暗く、問題解決の目処は立っていない。

がまあ一応、Civitaiはこの問題を解決すべく、引き続きSAI社と連絡を取り合っている。
という点でかろうじて首の皮一枚希望が残っている。
「最近のリーダーシップ変更」により事態が好転する可能性も一応ある。

2024/6/21 AIイラスト投稿サイト イロミライ がリリース

https://iromirai.jp/
UIはちちぷい寄り。ちちぷいにSNS機能が追加されたようなイメージ。
うちの子を持っている人はキャラクター単位のプロフィールページが持てる。
今回はベータ版でのリリースで、今後はモデルアップロード機能等が追加されるらしい。

2024/6/18 CivitaiのSD3が暫定的に非公開にされた

Temporary Stable Diffusion 3 Ban
SAI(Stability AI)社自身ではなく、Civitai運営による措置。
対象はSD3モデル、およびその派生モデルやLoRAを含む。
理由は、SD3についてのライセンスが明確でなく、懸念が大きいため。詳しくは上記civitai記事および2024/6/12の出来事を参照のこと。

2024/6/12 Ponyの次バージョンに関する続報

Pony Diffusion V7へ... いや、V6.9へ!
日本語訳の記事。Ponyの開発チーム(PurpleSmartAI)も、「Ponyモデルが日本人からも大きな支持を集めている」と認識している証だろうか。

翻訳元である英語版記事
Towards Pony Diffusion V7... I mean V6.9!
こちらの方が2日早く公開された。それもあってCivitaiユーザー達からの反応が多く、わかりやすい。

お知らせ内容の要約

  • 前回(4/29)のお知らせの時点では、SD3をベースにPony V7を作る予定だった。
  • 本日(6/12)SD3が公開されたが、特に商用ライセンスについて、SAI(Stability AI)社からの説明や回答が不十分なのでがっかり。
    • Ponyシリーズは大規模な追加学習を施して作っている。
      業務用の高性能なGPUをクラウドで長時間借りて作るので、お金がとてもかかる。
      収益化によって開発費を回収したり次バージョンの開発費を捻出する必要があるから、商用ライセンスの件はとても重要。
  • とりあえずSDXLをベースにしてPony V6.9を作るね……。
    改善点の内容は前回のお知らせで説明した通りで行く。
  • SD3をベースにしたPony V7を諦めたわけではないが、商用ライセンスの話次第でもある。

(参考) 前回のお知らせ(4/29)
Pony Diffusion V7へ向けて

2024/6/12 Stable Diffusion 3 リリース

最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表
https://ja.stability.ai/blog/stable-diffusion-3-medium
Stable Diffusion 3 クイックスタートガイド
https://education.civitai.com/quickstart-guide-to-stable-diffusion-3/

Demo Stable Diffusion 3 Medium (無料デモ)
https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

モデルの配布場所

2024/6/9 ComfyUIのとあるカスタムノードにキーロガーが仕込まれていたことが発覚

redditの下記スレが詳しい。
PSA: u/AppleBotzzのComfyUI_LLMVISIONノードを使用した場合、ハッキングされている可能性があります

ComfyUI本体に仕込まれていたわけではない。
カスタムノードと言って、1111で言う拡張機能のようなもの。
また、ComfyUIの作者が製作したカスタムノードではなく、第三者(AppleBotzz)によるもの。

2024/6/9 Forgeの今後について公式な告知

https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/801

ここまでの流れを時系列順に要約する。

  • (2/10) Development Plan #166
    「Forgeと1111を競合させるつもりはない」(意訳)
    「1111の速度とVRAM使用効率がForgeと同等かそれ以上に改善されたら、1111に合流してForgeは拡張機能にする」(意訳)
  • (3/8) 1111のv1.8.0をベースにした29be1daを最後に、Forgeの更新が途絶える。
  • (5/17) All perf improvements bundle #15821
    1111に高速化のプルリクが提出された。
    これを1111にマージして、起動オプションに--precision halfを書き足すと、少し高速化される。
    Forgeをわずかに上回ったり、Forgeにわずかに及ばなかったり。環境や生成条件によるようだ。
  • (6/8) 上記のプルリクが1111のdev版にマージされた。
  • 同日、イリヤちゃんから冒頭の告知あり。

つまり「1111が次バージョンでForgeと同等の速度になる」という見通しが立ったわけだ。

しかしForgeは速度以外にも強みを持っている。

  • VRAM管理が自動化されている。1111で言う--medvram等の起動オプションを
    手動で試さなくてもいいので、初心者でもSDXLモデルを扱いやすい。
  • DDPM等のサンプラーが実装されている。
  • LayerDiffuse等、独自の拡張機能が存在する。
    など

特にVRAM 6~8GB環境でSDXLモデルを扱いたい人にとっては
(あるいは12GB環境の人でも、出力したい画像サイズ等によっては)、
救世主のようなありがたい存在だったのである。
そういった事情から、イリヤちゃんからの公式告知には多数のコメントが寄せられている。

ともあれ、告知内容にある通り、今後のForgeはより実験的な内容になるとのこと。
これからのバージョンでは拡張機能が動作しなくなってしまう等のリスクが考えられる。
Forgeを愛用している人は、現行バージョンの環境を温存して、今後のアップデートはしばらく避けるほうが良いだろう。

2024/6/9 グラボ実売価格・6月

月1で調査しています。

  • いつもの価格調査あきが不在のようなので代理。代理なので寸評は勘弁な!
  • 傾向としては、3060(12GB)や4060Tiといった下位モデルが徐々に値上がり中。一方で終売予定の中位モデルが若干値下がり。

各GPUの速度比を算出するにあたって、やかもち先生の下記記事から描写時間(所要時間)の値をお借りしました。
【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】 | ちもろぐ
値をお借りしたグラフ: 1024 x 1536 Ayaka LoRA + SDXL Benchmark

GPUVRAM速度比*10TGP*11前回(5/3)今回(6/9)寸評
306012GB100%170W¥41,800¥42,620ローカルAI絵入門者向けのド定番。
VRAM・速度・価格のバランスが良い。
8GB版も存在するので、誤って購入しないよう注意。
4060Ti16GB150%165W¥68,800¥69,980比較的多めのVRAMが特長。
407012GB200%200W¥83,556¥84,799カード長270mm未満・8ピンx1の製品が多いため、
1000番台・2000番台からの移行がしやすい。
4070S12GB221%220W¥96,480¥94,800カード長270mm未満・16ピンx1の製品が多い。
ワッパ*12に優れるのも特長。
4070Ti12GB240%285W¥113,800¥104,980終売予定。カード長300mm以上・
16ピンx1の製品が多い点に注意。
4070TiS16GB265%285W¥127,980¥128,700
408016GB340%320W¥171,171¥163,152終売予定。
4080S16GB353%320W¥164,980¥163,9804080無印との速度差はごく僅か
409024GB516%450W¥279,800¥279,80028万円で安定している。

その他
AI用に新規購入するのはおすすめしないグラボたち。
VRAM量、速度、導入・運用の手間など、それぞれ理由が異なる。
ただしここに挙げられていても、既に所持している分は、しばらく活用するのも良いだろう。

  • GeForce
    3050, 3060(8GB), 4060, 4060Ti(8GB)など。
    VRAM 8GBのグラボを今からAI絵用に購入するのはおすすめできない。
  • Radeon:
    現状ではLinux(Ubuntu等)上でROCmを使用するのが高速だが、それでも速度/価格比ではGeForce系に若干及ばない。
    しかし最近はzludaを使用してWindowsでもROCmが動くバージョンが出てきているので、Windowsにおける速度面のハンデは減りつつある。
  • Intel Arc A770:
    8GB版と16GBがある。SD.nextなどoneAPI版の1111を利用する必要があるため、初心者向けではない。

2024/6/6 Telegram避難所開設

特長: エロに強い、すごくつよい

PCアプリ版、PCブラウザ版、スマホアプリ版、スマホブラウザ版などがある。
なおPCアプリ版はhttps://t.me/setlanguage/ja-rawを踏むことでUIの日本語化が可能。
「玄関口」の固定メッセージ(ピン留め)にも書いてある。

認証にはスマホのSMSが必要なのだが、「電話番号を送ったのにSMSが届かない!」というトラブルに遭遇しているAIあきが散見される……というか俺自身も経験した。
最初はスマホアプリ版で認証するといいかも。これだとSMSがちゃんと届いて認証が成功した。
その後はPCアプリ版とPCブラウザ版でも認証に成功した。

もっと見る
  • ふたばmay@避難所 ピン留め必読
    「玄関口」などとも呼ばれる。アカウント認証の後はまずこちらへどうぞ。
    Discord「裏」の「リンク集とtips」スレから辿って行くと良いかも。
    玄関口へ来れたら、ピン留めされている固定メッセージの内容をよく読もう。
  • 二次元避難所裏の裏
    「裏の裏」などとも呼ばれる。6/14現在の登録者数は2,600人くらい。
    • 「ローカルAIスレ」「AIエロ絵スレ」「NovelAIスレ」などが存在する。

よくありそうな質問

Q.俺の電話番号って公開されちゃうの?
A.としさんか? 自分から公開しない限りはされないから心配するな。
設定→プライバシーとセキュリティ を覗いて、色々「許可しない」に変更しとくといいぜ。

Q.これログは永久に残るの? ちょっと怖いなあ……
A.自分自身のレスに関しては、設定→プライバシーとセキュリティ→メッセージの自動削除
にて自動削除タイマーをセットできるよ。
削除したレスは相手の画面からも消える。
ただし、自動削除タイマーのセット前に送信したレス(過去の分)は、遡って適用されるわけではないと思う。

Q.テキストチャットにAI画像をアップロードする際、ファイル名やメタデータはどうなるの?
A.アップロードの仕方によるんだよ。

  • 「ファイル」としてアップロードする場合、再圧縮されないし、ファイル名やメタデータも維持される。(2バイト文字は未検証)
    ただしTelegram上では一旦サムネイルとして小さく表示される、という特徴がある。
  • 「写真」としてアップロードすると、自動的に非可逆圧縮されるのでメタデータは失われる。ファイル名も変わる。

Q.よく読むスレをお気に入りに登録するみたいな機能がなくて困っている。
A.PCブラウザ版ならスレのURLを確認できるので、スレ毎にブラウザにブクマしておくのもいいかも。

2024/6/3 Discordへの避難開始

Discord(ディスコード)は、テキストチャットやVC(ボイスチャット)を主としたツール。
おっさん向けに説明すると、ICQ、メッセンジャー、Skypeみたいなもの。
PCブラウザ版、PCアプリ版、スマホアプリ版などがある。

ふたば避難所系の鯖は基本的に招待制なので、鯖検索には出てこない。招待URLを踏む必要がある。
また多くの場合、招待URLには有効期限が設定されている。

米国基準なので、エロに厳しい。NSFW設定がされたチャンネルではもう少し許されるが。
ロリエロにはものすごく厳しい。NSFW設定がされたチャンネルであってもアウトです。
未成年者は色気を醸し出すこと自体が許されない、という気がしもす(故人の感想にごつ)。
チキンレース(ギリギリを探ること)自体やめましょう。人に尋ねない、迷ったら貼らない。

もっと見る

主な避難所鯖

  • ふたばmay@避難所
    「表」「避難所」などとも呼ばれる。6/14現在の登録者数は15,000人くらい。
    健全な話題が多いかな。NSFW設定のチャンネルも一部存在する。
    荒らし対策のため、参加に際して電話番号認証を設けている。
    • AI生成イラストの話題はまだちょっと慎重に取り扱う必要があるかな……(意訳)
      という鯖あきの方針により、他の鯖に委ねることになった。
      ただしAI絵以外のAI技術については「表」でも取り扱いOKとされ、
      「技術系」カテゴリに「ai技術」チャンネルが設けられた。
  • 🔞may避難所裏@でぃすこ
    「裏」「避難所裏」などとも呼ばれる。6/14現在の登録者数は17,000人くらい。
    表に比べ寛容な方針で運営されている。とはいえDiscordの規約上、ロリエロやショタエロはだめ。
  • ふたばAI避難所
    AI特化の専門避難所。去年(2023/4)から存在する。6/14現在の登録者数は1,400人くらい。
    「表」の「スレ避難所リンク集」から辿るといいかも。

なお各鯖のオンライン人数や登録者人数は、招待URLにアクセスする際に表示される。
参加した後でも、招待URLに再度アクセスすれば確認可能だ。

よくありそうな質問

Q.ディスコ初心者なんですけど…
A.そういうとしあきも多いので安心してください。
表でも裏でも「テスト」スレがいっぱい立ってますので、書き込みテストを試すと良いでしょう。
表なら「ディスコ初心者質問コーナー」
裏なら「質問に誰かがものすごい勢いで答えるスレ」を覗くのもおすすめです。

Q.アカウント作成について
A.「表示名」「ユーザー名」が公開されます。メアドは公開されません。
表示名やユーザー名は後から変更することも可能です。
表示名は鯖ごとに別々の内容を使い分けることができます(サーバーニックネーム)。
鯖ごとに別々のアバター(アイコン画像)を使い分けるためには、Nitro(月額課金)を有効にする必要があります。

Q.テキストチャットにAI画像をアップロードする際、ファイル名やメタデータはどうなるの?
A.ファイル名はそのまま残ります(ただし日本語などの2バイト文字は除く)
PNG形式ならメタデータが残りますが、JPGやWEBPでは失われるようです。
また閲覧者側の画像保存の仕方にもよります。
(PCブラウザ版の場合)画像左下の「ブラウザで開く」を選ぶと、メタデータが含まれている画像を閲覧できます。

Q.全体的な雰囲気はどう?
A.めちゃくちゃ平和! 平和すぎてビックリするビックリした。
あとカスタム絵文字文化が楽しい。職人がいて「そうだね」やレス画像をカスタム絵文字にしてくれてる。
ただDiscordの規約上、賑わいづらい話題も一部ありそう。エロ画像を貼りながら語らう系。

2024/6/3 荒らしの活動が激化

元々二次裏mayでは、様々な種類のスクリプトBotによる荒らし行為が常態化してしまっていた。

  • カタログ荒らし(スレ乱立)
    カタログの新順を見ての通り。
  • 埋め立て連投
    他のスレからレス内容をコピペしたり、
    同一スレ内のレス内容の単語順をシャッフルした上でコピペしてレスする、など。

しかもボットネット(botnet)を利用しているので、多数のIPを切り替えて悪用してくる。

また従来は一部のスレ(学◯アイ◯◯、バ◯ーガー◯◯等)が執拗に狙われていた印象だったが、この日辺りから対象範囲が急激に拡大された。
AI雑談スレも2スレ連続で埋め立て連投荒らしの被害を受けた。

この事態に対し、ふたばクンリニンからの動きは全く無し。
https://x.com/futabakanri2
https://jun.2chan.net/junbi/futaba.htm (準備板)
「こりゃもう駄目だな!」と見切りをつけ、Discordへ避難するとしあきが相次いだ(詳しくは別記事で案内します)。
またDiscordは「未成年のわいせつ画像に厳しい」等の事情もあるため、Telegram(テレグラム)へ避難するとしあきも存在する。

AI絵あき的には人工知能板の存在も大きい。
スレ寿命が大変長いため、必ずしも二次裏mayと同じ感覚では利用できないが、主要な避難所の一つになっている。
ただしスマホアプリの「futaber」を利用している人は注意が必要で、人工知能板を追加することができない。
一例を挙げると、「ふたったー」では人工知能板の追加と閲覧が可能だ。

2024/5

2024/5/29 (1111)v1.9.4

https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.9.4
約一ヶ月ぶりにホーチミンおじさんに動きあり。1111のv1.9.4がリリース。
内容は緊急性の高いhotfixが1件。新規インストール時に起動できないトラブルへの対応。

5/21にsetuptools 70.0.0がリリースされたことによる影響。
1111を新規にインストールする際、エラーを吐いて正常に起動できなくなってしまった。
この対策として「requirements_versions.txtの中でsetuptools 69.5.1を指定する」という暫定修正が施された。
今後のバージョンでは、より抜本的な修正が施されるようだ。

2024/5/21 (モデル)3x3x3mixXL

https://civitai.com/models/464044/3x3x3mixxl

なおVAEはこのモデルに内蔵されているものでは淡く灰色っぽくなるので、別のVAEを適用するといいだろう。
 例: sdxl.vae.safetensors (旧名SDXL-VAE-FP16-Fix)

しかしモデルに別のVAEを適用すると、読み込み時間とVRAM使用量が少し増す。
今後の利用頻度によっては、自分好みのVAEを内蔵させるのも手だ。
Checkpoint Merger#モデルに別のVAEを内蔵する

としあき達の反応

としあき達の反応

118 無念 Name としあき 24/05/21(火)21:29:07 ID:jCJwqpu6 No.1219297064 そうだねx4

1716294547686.jpg

3x3x3mixXLのディテール感おもしろい

133 無念 Name としあき 24/05/21(火)21:37:19 ID:I67xUwJY No.1219300891 そうだねx2

1716295039868.jpg

>3x3x3mixXLのディテール感おもしろい
いいよね 3x3

136 無念 Name としあき 24/05/21(火)21:37:35 ID:wGQzxcSE No.1219301022 そうだねx2

1716295055566.jpg

たておつ
3x3x3mixxlいいね

158 無念 Name としあき 24/05/21(火)21:51:36 ID:MZEl1NIU No.1219308067 そうだねx3

1716295896511.jpg

3x試したら描き込み凄くてびっくり

195 無念 Name としあき 24/05/21(火)22:18:31 ID:A8gIAju. No.1219320735 そうだねx2

1716297511755.jpg

たておつ
3x3x3mixなるほど
これはVAE指定しないといけないやつなのかな…?

33 無念 Name としあき 24/05/21(火)23:27:31 ID:A.EroQrA No.1219347504 そうだねx7

1716301651130.jpg

ちょっと話題になった3x3x3mixxlを導入したらpony系とは思えないほどの背景の書き込みだ

71 無念 Name としあき 24/05/22(水)00:06:13 ID:GTzvc3vM No.1219359734 そうだねx7

1716303973292.jpg

たておつ
日が変わってたまご料理の日
3x3x3確かに背景書き込みなかなかだね
おやすみ

87 無念 Name としあき 24/05/22(水)00:24:48 ID:/S9KU6mA No.1219365053 そうだねx6

1716305088685.webp

3x3x3すごいねこれ

106 無念 Name としあき 24/05/22(水)01:00:27 ID:eOpcWuwo No.1219374269 そうだねx7

1716307227214.jpg

3x3x3割とブロッコリー出せてるの凄い

135 無念 Name としあき 24/05/22(水)03:10:15 ID:x2mKp.yk No.1219392441 そうだねx4

1716315015265.webp

たておつ
3x3x3いいな天井に届きそうな勢いで射精してくれるの助かる

182 無念 Name としあき 24/05/22(水)07:25:19 ID:H6fOkid2 No.1219408679 そうだねx6

1716330319213.jpg

おはざつ
3x3x3楽しいモデルだね

2024/5/20 mayとimgの鯖が引っ越しされた

2024-05-22 143421.png
https://x.com/FutabaKanri2/status/1792153319986864286
これに伴い、複数のとしあきからトラブル報告があった。
何も問題なかった人、一時的にトラブルに遭遇した人など、この辺は環境によって人それぞれ。
もしかすると現在進行系で今もアクセスできてない人がいるかもしれない。

としあき達の反応

としあき達の反応

127 無念 Nameとしあき 24/05/20(月)22:27:09 ID:pkR1rjWk No.1218982488 そうだねx2
>>なんか今日スレが見れたり見れなかったりするんだけど不安定な日?
>自分もなんか不安定
mayの鯖移行中との話

133 無念 Nameとしあき 24/05/20(月)22:33:39 ID:x4EVRjh2 No.1218984624 そうだねx2
>>なんか今日スレが見れたり見れなかったりするんだけど不安定な日?
>リロードがよく失敗します
>関係ないけど暑いので女の子を薄着にしてごまかしましょうかね
水浴びも良い!
自分も20時くらいにリロード出来なかったりしたけど今は大丈夫になったよ

32 無念 Name としあき 24/05/21(火)01:05:18 ID:9l75j/Tc No.1219033711 そうだねx6
>前スレは途中でmayにアクセスできなくなって散々だった…
>でも最後に戻ってこれたのはよかったよ
自分は平気だけどアクセスできなくなった人もいるみたいね
もしかしたらだけど そういうときはDNSサーバの設定を8.8.8.8とかにするとアクセス出来たりするかも

33 無念 Name としあき 24/05/21(火)01:09:27 ID:/.yqmqwI No.1219034552 そうだねx3
そういえば鯖を新しいのに交換するって話あったけど今も不安定みたいね

144 無念 Name としあき 24/05/21(火)09:02:05 ID:qn2nF5xg No.1219084786 そうだねx5
たておつおはよう
ふたばアプリ繋がらずでdns設定変えたら繋がった

18 無念 Name としあき 24/05/21(火)12:28:53 ID:Gi59rkEQ No.1219125569 そうだねx9
>まだmayにアクセスできなくなるときがあって落ち着かないね…
dns更新の話があったからdnsキャッシュクリアすれば直るかも?

20 無念 Name としあき 24/05/21(火)12:36:28 ID:hpYx.jZg No.1219127899 そうだねx2
>まだmayにアクセスできなくなるときがあって落ち着かないね…
朝スレはスマホアプリからは見れなかった
ブラウザかでふたばトップから入ると行けたけど

93 無念 Name としあき 24/05/21(火)14:58:38 ID:GHRxTj8o No.1219162873 そうだねx3
アクセスしにくい時はDNSの設定を変えてみると良いかも

Google DNS
8.8.8.8 / 2001:4860:4860::8888

Cloudfare
1.1.1.1 / 2606:4700:4700::1111

2024/5/13 (モデル)ebara_pony_2.1

https://huggingface.co/tsukihara/xl_model
明るさ、目、LoRAの効き具合など、色々な点でv1とv2の中間みたいな印象。
好みに合わせてバージョンを選ぼう。

126 無念 Name としあき 24/05/13(月)22:15:36 ID:LPJzRI/. No.1216436855

1715606136415.jpg

ebara2.1は肌色が白飛びするのを抑えたらしい
確かに前よりはマシな気がする

145 無念 Name としあき 24/05/13(月)22:31:16 ID:FbDohJAA No.1216442977 そうだねx5

1715607076455.jpg

ebara比較 なるほど・・・
積極的に更新してくれるのはありがたい

147 無念 Name としあき 24/05/13(月)22:31:38 ID:LPJzRI/. No.1216443114 そうだねx5

1715607098849.jpg

ebara2.1は明るいところは眩しいけど全体的に抑えられてるね
これならVAEもちゃんと使えそうだ

210 無念 Name としあき 24/05/13(月)23:06:54 ID:lJgM0UgQ No.1216456507 そうだねx6

1715609214614.jpg

自環境ebara 比較
説明通り2.1は明るいのが抑えられてる感じだね

2024/5/12 (モデル)ebara_pony_2

https://huggingface.co/tsukihara/xl_model
ebara_ponyはスレでも人気になっているモデルの一つ。そのバージョン2が登場。
タレ目成分を抑えた以外に、色遣いも変わっている。
バージョン1は淡い色が特徴的だったが、2ではコントラストが強めになっている様子。
一方でLoRAの効き具合については、大きな変化がないものもあれば、効きが悪くなったものも一部あるようだ。

106 無念 Nameとしあき 24/05/12(日)20:16:02 ID:nbgiVZrY No.1216035378 そうだねx2

1715512562118.jpg

>>ebaraのv2がかみんぐ
>それはぜひ試してみないと
試してみた
絵柄はお好みで使い分け(それぞれ良さがある)
絵は明るくなったのでVAEは標準?のものでも良さそうな感じ

114 無念 Nameとしあき 24/05/12(日)20:19:49 ID:QuEmu09I No.1216037471 そうだねx3

1715512789093.png

ebaraでアヘ顔ダブルピース(bnp,qvj,oya,)
2のほうが好み

140 無念 Nameとしあき24/05/12(日)20:34:40 ID:vVQg8aAw No.1216046183 そうだねx4

1715513680952.png

ebaraのV2は自分の環境だと明るくなりすぎちゃったな

171 無念 Nameとしあき24/05/12(日)20:54:47 ID:vO.Psi8U No.1216057317 そうだねx1

1715514887804.png

ebara2使ってみた
確かに明るいね
とりあえずforgeならLatent Correction extensionで
若干暗くすることは可能だね

205 無念 Nameとしあき24/05/12(日)21:09:09 ID:QuEmu09I No.1216064725 そうだねx2

1715515749988.png

ebara2はvaeいらんかもね

255 無念 Nameとしあき24/05/12(日)21:25:25 ID:QuEmu09I No.1216072541 そうだねx4

1715516725503.png

あかざつ
ebara2は何か背景描き込みが素で多めだなfyxのときみたいな感じ

2024/5/3 グラボ実売価格・5月

月1で調査しています。

  • GWセール開催中! ……と言いたいがあまりパッとしない。
  • 3060(12GB)がジワジワ上がってきたこと以外は、変動が少なく全体的に落ち着いた相場になっている。

各GPUの速度比を算出するにあたって、やかもち先生の下記記事から描写時間(所要時間)の値をお借りしました。
【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】 | ちもろぐ
値をお借りしたグラフ: 1024 x 1536 Ayaka LoRA + SDXL Benchmark

GPUVRAM速度比*13TGP*14前回(4/2)今回(5/3)寸評
306012GB100%170W¥39,800¥41,800ローカルAI絵入門者向けのド定番。
VRAM・速度・価格のバランスが良い。
8GB版も存在するので、誤って購入しないよう注意。
4060Ti16GB150%165W¥68,800¥68,800比較的多めのVRAMが特長。
407012GB200%200W¥83,000¥83,556カード長270mm未満・8ピンx1の製品が多いため、
1000番台・2000番台からの移行がしやすい。
4070S12GB221%220W¥97,800¥96,480カード長270mm未満・16ピンx1の製品が多い。
ワッパ*15に優れるのも特長。
4070Ti12GB240%285W¥115,652¥113,800終売予定。カード長300mm以上・
16ピンx1の製品が多い点に注意。
4070TiS16GB265%285W¥128,900¥127,980ドスパラPalitの在庫が復活。
安価な製品が増え、価格が落ち着いてきた。
408016GB340%320W¥172,799¥171,171終売予定。安価な店の安価な製品は
11~12月に軒並み購入され尽くしてしまった。
4080S16GB353%320W¥169,700¥164,9804080無印との速度差はごく僅か
409024GB516%450W¥279,800¥279,80028万円で安定している。

その他
AI用に新規購入するのはおすすめしないグラボたち。
VRAM量、速度、導入・運用の手間など、それぞれ理由が異なる。
ただしここに挙げられていても、既に所持している分は、しばらく活用するのも良いだろう。

  • GeForce
    3050, 3060(8GB), 4060, 4060Ti(8GB)など。
    VRAM 8GBのグラボを今からAI絵用に購入するのはおすすめできない。
  • Radeon:
    現状ではLinux(Ubuntu等)上でROCmを使用するのが高速だが、それでも速度/価格比ではGeForce系に若干及ばない。
    Windows上で1111を利用したい場合はDirectMLを利用することになるが、速度面のハンデが大きく、ROCmを利用する場合に比べ1/3程度の速度になる。(最近はzludaを使用してWindowsでもROCmが動くバージョンが出てきているのでWindowsにおける速度面のハンデは減りつつある)
  • Intel Arc A770:
    8GB版と16GBがある。SD.nextなどoneAPI版の1111を利用する必要があるため、初心者向けではない。

*1 (参考) https://blog.comfy.org/new-models-versioned-release-beta-ui-new-models/
*2 3060(12GB)を基準にした速度比。
ForgeにてAnimagine XL V3(SDXL系列モデル)とLoRAを使用し、1024x1536の画像を出力した条件下での例。

*3 Total Graphics Power. グラボの総消費電力。VRAMやファンの分も含まれている。
*4 ワットパフォーマンス。消費電力に対する速度性能の高さ。
*5 https://civitai.com/articles/5732 のコメ欄
*6 環境や状況によっては、正しく示されない場合もあったかもしれない。
「「警告プロンプト」の通知が完全に正確なものではなく、より混乱を引き起こす可能性があることに気づきました」と翌日のお知らせにある。

*7 3060(12GB)を基準にした速度比。
ForgeにてAnimagine XL V3(SDXL系列モデル)とLoRAを使用し、1024x1536の画像を出力した条件下での例。

*8 Total Graphics Power. グラボの総消費電力。VRAMやファンの分も含まれている。
*9 ワットパフォーマンス。消費電力に対する速度性能の高さ。
*10 3060(12GB)を基準にした速度比。
ForgeにてAnimagine XL V3(SDXL系列モデル)とLoRAを使用し、1024x1536の画像を出力した条件下での例。

*11 Total Graphics Power. グラボの総消費電力。VRAMやファンの分も含まれている。
*12 ワットパフォーマンス。消費電力に対する速度性能の高さ。
*13 3060(12GB)を基準にした速度比。
ForgeにてAnimagine XL V3(SDXL系列モデル)とLoRAを使用し、1024x1536の画像を出力した条件下での例。

*14 Total Graphics Power. グラボの総消費電力。VRAMやファンの分も含まれている。
*15 ワットパフォーマンス。消費電力に対する速度性能の高さ。