Animagine XL のQuality Modifiers, Aesthetic Tags の違いによる出力の違いの比較をします。
Animagine XL では、従来からある Quality Modifiers 以外に Aesthetic Tags が導入されています。
同じプロンプトで、Quality Modifiers や Aesthetic Tagsを変化させることで出力にどのような違いがあるかを確認します。
リリースノートによると、Quality Modifiersは画像のスコアと閲覧者からの評価を考慮してスコア付けされているポイントとされています。
以下のタグが設定されています。
Quality Modifier(タグ) | Score Criterion (スコアの範囲) |
---|---|
masterpiece | > 95% |
best quality | > 85% & ≤ 95% |
great quality | > 75% & ≤ 85% |
good quality | > 50% & ≤ 75% |
normal quality | > 25% & ≤ 50% |
low quality | > 10% & ≤ 25% |
worst quality | ≤ 10% |
リリースノートによると、視覚的な魅力に基づいてコンテンツの分類をしたとあります。
「視覚的に魅力的である」ということですが、主観的な要素もあり、今回どのような違いが出るかを確認します。
以下のタグが設定されています。
Aesthetic Tag(タグ) | Score Range (スコアの範囲) |
---|---|
very aesthetic | > 0.71 |
aesthetic | > 0.45 & < 0.71 |
displeasing | > 0.27 & < 0.45 |
very displeasing | ≤ 0.27 |
リリースノートによると、年代を指定してその時代のスタイルを出力できるとあります。
以下のタグが設定されています。
Year Tag(タグ) | Year Range (スコアの範囲) |
---|---|
newest | 2021 to 2024 |
recent | 2018 to 2020 |
mid | 2015 to 2017 |
early | 2011 to 2014 |
oldest | 2005 to 2010 |
センシティブ画像に関する以下のタグが設定されています。
Rating Modifier(タグ) | Rating Criterion (レーティング) |
---|---|
safe | General |
sensitive | Sensitive |
nsfw | Questionable |
explicit, nsfw | Explicit |
次のプロンプトを利用して、Quality Modifiersの違いを比較します。
品質タグがない状態の出力です。こちらが基準になります。
masterpieceを指定した出力です。なしの場合より品質が良く見えます。
best qualityを指定した出力です。なしの場合より品質が良く見えます。
great qualityを指定した出力です。なしの場合より品質が良いですが、masterpieceやbest qualityよりは品質が低く見えます。
great qualityを指定した出力です。怪しい出力もぼちぼち出てきます。
normal qualityを指定した出力です。品質は下がってきています。
low qualityを指定した出力です。
worst qualityを指定した出力です。
品質タグを変化させると、品質が変化する状況が確認できました。
今回masterpieceを指定した場合でも、Prompt1では、やや崩れる画像が出力されていますが、これは、low quality や worst quality の
学習結果が影響している可能性が考えられます。品質を上げた状態で安定させたい場合には、Prompt2のように、
ネガティブプロンプトにlow quality,worst qualityなどの低品質を除外するタグを指定したほうが出力結果が良くなります。
続いて、次のプロンプトを利用してAesthetic Tagsの違いを比較します。
プロンプトにQuality Modifiersの上位3つ masterpiece, best quality, great quality
を入れ、
ネガティブプロンプトにQuality Modifiersの下位3つ worst quality, low quality, normal quality
を入れ、クオリティは高い状態の出力にしたうえで、
Aestheticタグを変化させて違いを確認します。
Aestheticタグの指定がない場合の出力です。こちらが基準になります。
very aestheticを指定した場合の出力です。タグなしと比較すると、画面にキャラクターが大きく描かれており、余白が少ない印象を受けます。
aestheticを指定した場合の出力です。very aestheticと比較するとキャラクターがやや小さく描かれ、余白が若干多い印象があります。
displeasingを指定した場合の出力です。稀ですが、キャラクターの体が崩れた画像が生成される場合があります。
ペイントがaesthetic, very aestheticと比較すると、若干フラット感がある印象です。
very displeasingを指定した場合の出力です。キャラクターの体が崩れた画像が生成される場合があります。
ペイントは立体感が抑えられ、フラット感がある印象です。
Aestheticタグを変化させると出力画像にある程度の変化があることが確認できました。
displeasing, very displeasingを指定すると、塗りは立体感が弱くなりフラット感のあるペイントになる印象です。
また、低頻度ですが、キャラクターの体が崩れる場合があることが確認できました。
displeasing, very displeasingが美的に劣るかという点については、何とも言えないですが、very aestheticを指定した場合の
立体感のあるペイントのほうがペインティングの手間はかかっている印象を受けます。
次のプロンプトを利用して、Year Modifiersの違いを比較します。
Year Modifiersタグを指定しない場合の出力です。こちらが基準になります。
newestを指定した場合の出力です。他の出力と比較すると、頬の赤みが強い印象と光沢感の表現が若干強めの印象があります。
また、顎が細く鋭い印象を受けます。
recentを指定した場合の出力です。
midを指定した場合の出力です。newestやrecentと比較すると、若干色が淡いものと、彩度の高いものがある印象を受けます。
earlyを指定した場合の出力です。newestやrecentと比較するとややフラット感がある印象です。
彩度の高い画像の出力も目につきます。
若干絵柄の変化も見られます。
oldestを指定した場合の出力です。oldestでは、絵柄の変化も見られ、レトロ感のあるキャラクターの絵がの出力になります。
フラット感が高いペイントが多く、彩度の高い画像の出力も見られます。使用している色数を抑える傾向もありそうです。
Year Modifiersタグを変化させると出力画像にある程度の変化があることが確認できました。
古い年代を指定するとフラット感が若干高まる印象です。また、oldestを指定すると絵柄の変化も見られます。
midやearlyではまつ毛の表現が控えめになっており、全体的に華やかさが抑えられた絵柄になる傾向があります。