Illustrious XL系モデルを利用して生成した画像の品質が低い
Illustrious XL系モデルを利用して生成した画像の品質が低い現象と対処法を紹介します。
概要
Illustrious XL系モデルを利用して画像を生成すると、従来のモデルと比べて生成された画像の品質が低い場合があります。
この記事では、Illustrious XL系モデルを利用して生成した画像の品質が低い現象と対処法を紹介します。
原因1: 解像度
Illustrious XL は大きい解像度の画像で学習されているため、これまでのモデルより、
出力画像のサイズを大きくしたほうが出力結果が良くなる傾向があります。
画像の短辺が1024ピクセルから1200ピクセルの範囲で画像を生成すると品質が改善される場合があります。
補足
SDXL, Animagine XL, PonyDiffusion XL 系のモデルとマージされたモデルの場合、小さいサイズでも画像生成の品質が落ちないモデルもあります。
以下、出力画像の解像度の違いによる結果を比較します。
以下のプロンプトで画像を生成します。
Prompt
Prompt: 1gir, blue windbreaker, white long skirt, white sneakers, standing, fullbody, masterpiece, best quality, very aesthetic, highres
Negative prompt: worst quality, low quality, bad quality, lowres, text
Model: Illustrious-XL-v0.1
Steps: 30, Sampler: Euler a, Schedule type: Automatic
画像生成結果は下図です。
256×341
512×682
600×800
680×906
横幅256ピクセルではノイズになってしまい画像は生成できていません。512ピクセル以上ではプロンプトに沿った画像は生成できていますが、
プロンプト追従が弱かったり、頭身の振れ幅が大きいなど品質があまり良くないです。
768×1024
800×1066
960×1280
1024×1365
横幅768ピクセルでは、SDXLモデルやAnimagine XLでは比較的品質が高い画像が生成できますが、Illustrious-XLの場合は、
おおむねプロンプト通りに画像は生成できますが、アウトラインの輪郭線が太い場合があったり、頭身の振れ幅が大きい場合や、
ノイズが目立つ場合があり、若干品質は低い印象です。
横幅が800ピクセルを超えると、出力画像に安定感が出てきます。
1080×1440
1152×1536
1200×1600
1280×1706
横幅1080ピクセルから1280ピクセルの間ではプロンプト通りの画像が出力され、画像の振れ幅もそれほど大きくない状態です。
横幅が1280ピクセルの場合は、やや頭身が高すぎる印象もあります。
1366×1820
1440×1920
1536×2048
1600×2133
横幅が1300ピクセルを超えると、画像に崩れが目立ち始めます。
原因2: プロンプト(1)
Pony系のプロンプトを利用している場合、生成画像の品質が低くなることがあります。
詳しくはこちらの記事 を参照してください。
なお、Illustriousでは品質タグは以下で学習されています。
worst quality
bad quality
average quality
good quality
best quality
masterpiece quality
masterpiece
ドキュメントにはありませんが、Animagine XLのAesthetic タグも有効な場合があるようです。
very aesthetic
aesthetic
displeasing
very displeasing
一般的に使われる品質 Prompt
low contrast, good quality, best quality, masterpiece
一般的に使われるNegative Prompt
worst quality, comic, multiple views, bad quality, low quality, lowres, displeasing, very displeasing, bad anatomy, bad hands, scan artifacts,
原因3: プロンプト(2): 表情集が生成される
プロンプトによっては以下の出力結果のような表情集が出力される場合があります。
上記画像の出力には以下のプロンプトを利用しています。
プロンプトに "expression" の語句がありますが、SDXLやAnimagine XL, Pony diffusion XL では表情の意味で理解され表情集の画像は生成されにくいですが、
Illustriousの場合には、「表情集」の意味に解釈されるため、上図の表情集の画像が生成されます。
Prompt
Prompt: 1girl, smile expression, upper chest shot, black shirt, brown hair, holding a pen, masterpiece, best quality, highres
Negative prompt: worst quality, bad quality, low quality, lowres
表情集的な画像の生成を防ぐ場合には、expression をプロンプトに含めずに生成します。
Prompt
Prompt: 1girl, smile, upper chest shot, black shirt, brown hair, holding a pen, masterpiece, best quality, highres
Negative prompt: worst quality, bad quality, low quality, lowres
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。
最近は生成AIの画像生成の沼に沈んでいる。