Illustrious XL系モデルを利用して生成した画像の品質が低い

Illustrious XL系モデルを利用して生成した画像の品質が低い現象と対処法を紹介します。

概要

Illustrious XL系モデルを利用して画像を生成すると、従来のモデルと比べて生成された画像の品質が低い場合があります。 この記事では、Illustrious XL系モデルを利用して生成した画像の品質が低い現象と対処法を紹介します。

原因1: 解像度

Illustrious XL は大きい解像度の画像で学習されているため、これまでのモデルより、 出力画像のサイズを大きくしたほうが出力結果が良くなる傾向があります。
画像の短辺が1024ピクセルから1200ピクセルの範囲で画像を生成すると品質が改善される場合があります。

補足
SDXL, Animagine XL, PonyDiffusion XL 系のモデルとマージされたモデルの場合、小さいサイズでも画像生成の品質が落ちないモデルもあります。


以下、出力画像の解像度の違いによる結果を比較します。

以下のプロンプトで画像を生成します。

Prompt
Prompt: 1gir, blue windbreaker, white long skirt, white sneakers, standing, fullbody, masterpiece, best quality, very aesthetic, highres
Negative prompt: worst quality, low quality, bad quality, lowres, text
Model: Illustrious-XL-v0.1
Steps: 30, Sampler: Euler a, Schedule type: Automatic


画像生成結果は下図です。

256×341
256×341 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像1

512×682
512×682 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像2

600×800
600×800 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像3

680×906
680×906 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像4

横幅256ピクセルではノイズになってしまい画像は生成できていません。512ピクセル以上ではプロンプトに沿った画像は生成できていますが、 プロンプト追従が弱かったり、頭身の振れ幅が大きいなど品質があまり良くないです。

768×1024
768×1024 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像5

800×1066
800×1066 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像6

960×1280
960×1280 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像7

1024×1365
1024×1365 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像8

横幅768ピクセルでは、SDXLモデルやAnimagine XLでは比較的品質が高い画像が生成できますが、Illustrious-XLの場合は、 おおむねプロンプト通りに画像は生成できますが、アウトラインの輪郭線が太い場合があったり、頭身の振れ幅が大きい場合や、 ノイズが目立つ場合があり、若干品質は低い印象です。
横幅が800ピクセルを超えると、出力画像に安定感が出てきます。

1080×1440
1080×1440 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像9

1152×1536
1152×1536 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像10

1200×1600
1200×1600 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像11

1280×1706
1280×1706 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像12

横幅1080ピクセルから1280ピクセルの間ではプロンプト通りの画像が出力され、画像の振れ幅もそれほど大きくない状態です。 横幅が1280ピクセルの場合は、やや頭身が高すぎる印象もあります。

1366×1820
1366×1820 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像13

1440×1920
1440×1920 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像14

1536×2048
1536×2048 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像15

1600×2133
1600×2133 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像16

横幅が1300ピクセルを超えると、画像に崩れが目立ち始めます。

原因2: プロンプト(1)

Pony系のプロンプトを利用している場合、生成画像の品質が低くなることがあります。
詳しくはこちらの記事を参照してください。


なお、Illustriousでは品質タグは以下で学習されています。

  • worst quality
  • bad quality
  • average quality
  • good quality
  • best quality
  • masterpiece quality
  • masterpiece


ドキュメントにはありませんが、Animagine XLのAesthetic タグも有効な場合があるようです。

  • very aesthetic
  • aesthetic
  • displeasing
  • very displeasing


一般的に使われる品質 Prompt
low contrast, good quality, best quality, masterpiece
一般的に使われるNegative Prompt
worst quality, comic, multiple views, bad quality, low quality, lowres, displeasing, very displeasing, bad anatomy, bad hands, scan artifacts,

原因3: プロンプト(2): 表情集が生成される

プロンプトによっては以下の出力結果のような表情集が出力される場合があります。

Illustrious XL系モデルを利用して生成した画像の品質が低い:画像17

上記画像の出力には以下のプロンプトを利用しています。
プロンプトに "expression" の語句がありますが、SDXLやAnimagine XL, Pony diffusion XL では表情の意味で理解され表情集の画像は生成されにくいですが、 Illustriousの場合には、「表情集」の意味に解釈されるため、上図の表情集の画像が生成されます。

Prompt
Prompt: 1girl, smile expression, upper chest shot, black shirt, brown hair, holding a pen, masterpiece, best quality, highres
Negative prompt: worst quality, bad quality, low quality, lowres


表情集的な画像の生成を防ぐ場合には、expression をプロンプトに含めずに生成します。

Prompt
Prompt: 1girl, smile, upper chest shot, black shirt, brown hair, holding a pen, masterpiece, best quality, highres
Negative prompt: worst quality, bad quality, low quality, lowres

Illustrious XL系モデルを利用して生成した画像の品質が低い:画像18

AuthorPortraitAlt
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。 最近は生成AIの画像生成の沼に沈んでいる。
作成日: 2024-10-09
Copyright © 1995–2025 iPentec all rights reserverd.