iPentec.com / Document / カテゴリ: 画像生成 / タグ: 画像生成 Stable Diffusion Illustrious XL

Illustrious XL系モデルを利用して生成した画像の品質が低い

概要

Illustrious XL系モデルを利用して画像を生成すると、従来のモデルと比べて生成された画像の品質が低い場合があります。この記事では、Illustrious XL系モデルを利用して生成した画像の品質が低い現象と対処法を紹介します。

原因1: 解像度

Illustrious XL は大きい解像度の画像で学習されているため、これまでのモデルより、出力画像のサイズを大きくしたほうが出力結果が良くなる傾向があります。
画像の短辺が1024ピクセルから1200ピクセルの範囲で画像を生成すると品質が改善される場合があります。

補足

SDXL, Animagine XL, PonyDiffusion XL 系のモデルとマージされたモデルの場合、小さいサイズでも画像生成の品質が落ちないモデルもあります。

以下、出力画像の解像度の違いによる結果を比較します。

以下のプロンプトで画像を生成します。

Prompt

Prompt: 1gir, blue windbreaker, white long skirt, white sneakers, standing, fullbody, masterpiece, best quality, very aesthetic, highres
Negative prompt: worst quality, low quality, bad quality, lowres, text
Model: Illustrious-XL-v0.1
Steps: 30, Sampler: Euler a, Schedule type: Automatic

画像生成結果は下図です。

256×341 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像1 — 256×341

512×682 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像2 — 512×682

600×800 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像3 — 600×800

680×906 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像4 — 680×906

横幅256ピクセルではノイズになってしまい画像は生成できていません。512ピクセル以上ではプロンプトに沿った画像は生成できていますが、プロンプト追従が弱かったり、頭身の振れ幅が大きいなど品質があまり良くないです。

768×1024 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像5 — 768×1024

800×1066 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像6 — 800×1066

960×1280 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像7 — 960×1280

1024×1365 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像8 — 1024×1365

横幅768ピクセルでは、SDXLモデルやAnimagine XLでは比較的品質が高い画像が生成できますが、Illustrious-XLの場合は、おおむねプロンプト通りに画像は生成できますが、アウトラインの輪郭線が太い場合があったり、頭身の振れ幅が大きい場合や、ノイズが目立つ場合があり、若干品質は低い印象です。
横幅が800ピクセルを超えると、出力画像に安定感が出てきます。

1080×1440 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像9 — 1080×1440

1152×1536 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像10 — 1152×1536

1200×1600 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像11 — 1200×1600

1280×1706 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像12 — 1280×1706

横幅1080ピクセルから1280ピクセルの間ではプロンプト通りの画像が出力され、画像の振れ幅もそれほど大きくない状態です。横幅が1280ピクセルの場合は、やや頭身が高すぎる印象もあります。

1366×1820 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像13 — 1366×1820

1440×1920 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像14 — 1440×1920

1536×2048 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像15 — 1536×2048

1600×2133 - Illustrious XL系モデルを利用して生成した画像の品質が低い:画像16 — 1600×2133

横幅が1300ピクセルを超えると、画像に崩れが目立ち始めます。

原因2: プロンプト(1)

Pony系のプロンプトを利用している場合、生成画像の品質が低くなることがあります。
詳しくはこちらの記事を参照してください。

なお、Illustriousでは品質タグは以下で学習されています。

worst quality
bad quality
average quality
good quality
best quality
masterpiece quality
masterpiece

ドキュメントにはありませんが、Animagine XLのAesthetic タグも有効な場合があるようです。

very aesthetic
aesthetic
displeasing
very displeasing

一般的に使われる品質 Prompt

low contrast, good quality, best quality, masterpiece

一般的に使われるNegative Prompt

worst quality, comic, multiple views, bad quality, low quality, lowres, displeasing, very displeasing, bad anatomy, bad hands, scan artifacts,

原因3: プロンプト(2): 表情集が生成される

プロンプトによっては以下の出力結果のような表情集が出力される場合があります。

Illustrious XL系モデルを利用して生成した画像の品質が低い:画像17

上記画像の出力には以下のプロンプトを利用しています。
プロンプトに "expression" の語句がありますが、SDXLやAnimagine XL, Pony diffusion XL では表情の意味で理解され表情集の画像は生成されにくいですが、 Illustriousの場合には、「表情集」の意味に解釈されるため、上図の表情集の画像が生成されます。

Prompt

Prompt: 1girl, smile expression, upper chest shot, black shirt, brown hair, holding a pen, masterpiece, best quality, highres
Negative prompt: worst quality, bad quality, low quality, lowres

表情集的な画像の生成を防ぐ場合には、expression をプロンプトに含めずに生成します。

Prompt

Prompt: 1girl, smile, upper chest shot, black shirt, brown hair, holding a pen, masterpiece, best quality, highres
Negative prompt: worst quality, bad quality, low quality, lowres

Illustrious XL系モデルを利用して生成した画像の品質が低い:画像18

著者

とりっち

iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。最近は生成AIの画像生成の沼に沈んでいる。

作成日: 2024-10-09

目次

Illustrious XL系モデルを利用して生成した画像の品質が低い

目次

概要

原因1: 解像度

原因2: プロンプト(1)

原因3: プロンプト(2): 表情集が生成される

関連するページ