Hugging Faceでお試しMitsua Diffusion One
Hugging Faceとは
URL:https://huggingface.co/Mitsua/mitsua-diffusion-one
Hugging Faceは機械学習を対象にしたオープンソースプラットフォームです。
Mitsua Diffusion OneのモデルはHugging Faceで公開されており、ライセンスや学習ソースを確認できます。
お試し生成
Hugging Face上では簡単な画像生成を試すことが出来ます。
PCでは画面右側、スマホではページ上部にある「⚡Hosted inference API」にText-to-imageの項目があります。
空欄にプロンプトを入力し、「Compute」ボタンを押すと画像が生成されます。
※NSFWフィルターがかかっているため、肌色面積の多い画像やグロテスクな画像はブラックアウトになることがあります。
Google Colabで始めるMitsua Diffusion One
はじめに
この項目では、Shamelessly AI Generated氏が作成したColabノートブックでMitsua Diffusion Oneを使用する方法について説明します。
URL:https://colab.research.google.com/drive/1E5Fa2Tu04g3kb443WnrhbWNhoMzcijoj
Google Colabとは
ColabはGoogle社が提供する、WebブラウザからPythonプログラムを実行できるサービスです。スマホでも一応動かせます。
無料で使えますが、より高性能なGPUを使いたい場合はColab Proの購入が必要です。
接続後にしばらく放置したり、PCをスリープモードにしたりするとタイムアウトになり、最初から実行をやり直すことになるので注意してください。
Step1の実行
「Step 1 - Install Diffusers, Setup, etc」のセルを実行します。実行は▶ボタンのクリックかCtrl+Enterで行えます。
セキュリティに関する警告が出るため、ノートブックの作者を信頼して進める場合は「このまま実行」を選んでください。
セットアップ
「Prompt and Generation」のセルを編集してセットアップを行います。
初めての場合はとりあえずprompt・negative_promptのみ編集することをおすすめします。
編集項目
- prompt
プロンプト。AIへの指示文。""(ダブルクォーテーション)で括る。
このノートブックはDynamic Promptに対応しており、{word1 | word2 | word3}と書けばword1~3の単語がランダムでプロンプトに反映される。 - negative_prompt
ネガティブプロンプト。AIへの除外・抑制指示。プロンプトと同じく""で括る。
ugly,low quality,blurryといった単語を指定して絵のクオリティを上げたり、絵画らしくするためphotoを抑制して画風を調整するのに使われる。
デフォルトで使用されている「NE4Mitsua」は専用ネガティブTIで、ネガティブプロンプトに使用すると画像のクオリティが上がるように調整されている。 - height / width
画像サイズの高さ、幅。ピクセル単位。 - num_inference_steps
ステップ数。高くするほど描き込み量が増えるが、40~50から数値を上げても差が少なくなる。 - guidance_scale
プロンプトの重み、忠実度。一般的には6~10程度で調整される。 - num_of_prompts
プロンプトの種類数。Dynamic Promptでプロンプトをランダム生成した時のバリエーション数。 - num_images_per_prompt
各プロンプトごとの画像生成数。最終的に生成される枚数は、num_of_prompts×num_images_per_promptと掛けた数になる。 - seed
シード値。-1の場合はランダム生成。
シード値を固定すると同じ構図の画像が生成されるため、プロンプトや設定の微調整を行う場合に固定すると良い。
生成!
編集が終わったら「Prompt and Generation」セルを実行して画像を生成できます。
Mitsua Diffusion Oneに好きなだけ絵を描いてもらいましょう!