Stable Diffusion XL (Illustrious XL / NoobAI-XL 系)のアニメ / イラスト系 モデルの違いによる出力イメージの比較の紹介です。
イラスト系画像を大規模学習した、Illustrious XL / NoobAI-XL モデルが登場し、チューニングされたモデルも登場してきています。
この記事では、Illustrious XL / NoobAI-XL 系のモデルでの生成画像比較を紹介します。
以下のプロンプトを利用して、モデルごとの画像の生成結果の違いを確認します。
プロンプト2は画像生成が苦手そうな内容にしています。
Illustrious XL v1.1と比較すると、全体のカラーが鮮やかになった傾向があります。細部の描画は控えめになっており、フラット感がやや増している印象があります。
v1.1より品質が低い印象がありますが、v2.0の場合はアーティストタグを利用すると品質が上がる傾向にあり、何も指定しない場合は、
v1.1より品質が低い傾向があるようです。
v1.0より、生成画像のコントラストが若干弱くなり明るい画像が生成されます。一方画像の崩れがやや増加しており、Propt2ではやや崩れが目立つ印象です。
V-Predモデルのため、サンプリングメソッドをEularに設定しています。
鮮やかで暗い画像が生成されます。背景はシンプルでベタ塗りの面積が大きく、描画量や描画密度は少なくなる傾向です。
今回のプロンプトではわかりにくいですが、プロンプトによっては、とてもリアルな画像が生成される場合があります。
v3.0と比較すると若干コントラストが下がった印象です。Prompt2の車はカラフルな色の出力にはならず、車のデザインはリアル感が増しています。
V-Predモデルのため、サンプリングメソッドをEularに設定しています。
出力画像の彩度はやや高めになり、背景がシンプルになる傾向があります。
v7と比較すると若干彩度とコントラストが下がった印象があります。
今回のプロンプトでは確認できませんが、v7では1人物を描画するプロンプトで2人物描画されるケースがあり、
プロンプト追従が低い場合がありました。また、稀に体が崩れるばあいがありましたが、v8では改善されています。
リアリスティックな画像やマージモデルの学習影響があるためか、車のリアル感が高くなっています。カラフル感もあります。
他のモデルと比較すると、黄色味がやや強い画像が生成される傾向です。
カラーは鮮やかで、細部まで描画された画像が出力されます。
v4.0に比べてかなりパステルカラー感が強まっている印象です。
v3.0と比較すると、オレンジ色味(セピア感)が弱まっています。v3.0では表現されていた、Prompt2の"downtown"の要素は反映されなくなっています。
v14と比較すると、僅かに青みが弱まった印象です。キャラクターの髪色にバリエーションが増えています。
前バージョンと比較すると黄色味が減り、爽やかなカラーリングになった印象です。
他のモデルと比較すると暖色系のカラーリングになる印象です。
v2.0より、緑味が減り青みのある画像が生成されます。細部の描画は控えめになった印象です。
v4以降はソフト感の強い画像が生成されます。若干眠たい印象の画像が生成されるため、プロンプトの工夫が必要な印象です。
(vivid color, anime shading を加えると改善が見られます。)
画像の崩れも少なく安定した出力の印象です。
v3と比較すると若干カラーが明るくなった印象です。
v10と比較すると彩度が上がり、カラフル感があります。
v2と比較すると発色がはっきりする傾向にあります。他のモデルと比較するとキャラクターにフォーカスされて生成される傾向があります。
今回のプロンプトではわかりにくいですが、キャラクターを生成すると、他のモデルよりダイナミックな構図になりやすいです。
Animagine 4.0に近いテイストの画像が生成されます。バリエーションは狭いですが、他のモデルとは異なる画像が生成されます。
バリエーションの幅は狭めですが、安定して崩れにくい画像生成結果になる印象です。細部まで描画される傾向にあります。Prompt2 の車はリアルな出力結果の傾向です。
v4.0と比較すると彩度が若干上がった印象があります。フラット感が抑えられ、やや立体感のあるペイントになった印象です。
彩度が高めでコントラストがはっきりした画像が生成される傾向です。カラーリングはやや暖色系よりです。細部の描画がしっかりされる印象です。
また、今回のプロンプトではわかりにくいですが、背景が若干他のモデルと違った出力になる印象です。
v1.4との比較では若干黄色みが抑えられたカラーリングになる印象です。Prompt2はほとんど崩れることなく描画できています。
安定感のある出力結果の印象です。
Animagine XL v4.0はIllustrious系モデルより崩れるケースが若干多いですが、バリエーションの幅は広い印象です。
プロンプト追従性もよく、Prompt2ではdowntownの要素や2door carも反映されています。
また、今回のプロンプトではわかりにくいかもしれませんが、手指はIllustrious系モデルより弱い印象があります。
Illustrious系モデルと比較すると、Prompt1はバリエーションの幅が若干狭い印象です。また、Prompt2はリアル感の強い出力になり、キャラクターが目立たない描画になります。