Animaの画像生成結果、SDXL(Illustrious)との比較

ぐあもん
質問: Animaモデル
Animaの画像生成結果を見てみたいです。また、Animaのほうが後発ですが、 SDXL(Illustrious)と比べて、どういった点が良いのでしょうか?

生成画像の比較

以下のプロンプトで画像を生成します。
他のモデルの生成結果はこちらの記事を参照してください。
ここで紹介しているプロンプトの記述はあまり良くないかもしれません。プロンプトを詳細に記述する、scoreタグを記述したほうが品質が良くなる可能性があります。

1: 非常階段のアニメ画像

Prompt
Prompt: Three girls are sitting side by side on the landing of the japanese school's emergency stairs on the fifth floor, which are made of iron and located on the outside of the building. masterpiece, best quality
Negative prompt: worst quality, low quality


生成結果は下図です。かなりロングショットの構図になります。

Anima 1.0 base

Animaの画像生成結果、SDXL(Illustrious)との比較:画像1
Animaの画像生成結果、SDXL(Illustrious)との比較:画像2
Animaの画像生成結果、SDXL(Illustrious)との比較:画像3
Animaの画像生成結果、SDXL(Illustrious)との比較:画像4

Anima Preview 3

Animaの画像生成結果、SDXL(Illustrious)との比較:画像5
Animaの画像生成結果、SDXL(Illustrious)との比較:画像6
Animaの画像生成結果、SDXL(Illustrious)との比較:画像7
Animaの画像生成結果、SDXL(Illustrious)との比較:画像8

Anima Preview 2

Animaの画像生成結果、SDXL(Illustrious)との比較:画像9
Animaの画像生成結果、SDXL(Illustrious)との比較:画像10
Animaの画像生成結果、SDXL(Illustrious)との比較:画像11
Animaの画像生成結果、SDXL(Illustrious)との比較:画像12

Anima Preview 1

Animaの画像生成結果、SDXL(Illustrious)との比較:画像13
Animaの画像生成結果、SDXL(Illustrious)との比較:画像14
Animaの画像生成結果、SDXL(Illustrious)との比較:画像15
Animaの画像生成結果、SDXL(Illustrious)との比較:画像16

2: ガスタンク車

Prompt
Prompt: Freight train yard, railroad tank car, low angle, train railway, wide view, realistic
Negative prompt: worst quality, low quality


生成結果は下図です。ガスタンク車は表現されませんでした。

Anima 1.0 base

Animaの画像生成結果、SDXL(Illustrious)との比較:画像17
Animaの画像生成結果、SDXL(Illustrious)との比較:画像18
Animaの画像生成結果、SDXL(Illustrious)との比較:画像19
Animaの画像生成結果、SDXL(Illustrious)との比較:画像20

Anima Preview 3

Animaの画像生成結果、SDXL(Illustrious)との比較:画像21
Animaの画像生成結果、SDXL(Illustrious)との比較:画像22
Animaの画像生成結果、SDXL(Illustrious)との比較:画像23
Animaの画像生成結果、SDXL(Illustrious)との比較:画像24

Anima Preview 2

Animaの画像生成結果、SDXL(Illustrious)との比較:画像25
Animaの画像生成結果、SDXL(Illustrious)との比較:画像26
Animaの画像生成結果、SDXL(Illustrious)との比較:画像27
Animaの画像生成結果、SDXL(Illustrious)との比較:画像28

Anima Preview 1

Animaの画像生成結果、SDXL(Illustrious)との比較:画像29
Animaの画像生成結果、SDXL(Illustrious)との比較:画像30
Animaの画像生成結果、SDXL(Illustrious)との比較:画像31
Animaの画像生成結果、SDXL(Illustrious)との比較:画像32

3: 自転車に乗っているシーンを正面から

Prompt
Prompt: 1girl, bicycle, riding bicycle, a girl is riding a bicycle, straight-on, full body, anime coloring style, masterpiece, best quality
Negative prompt: worst quality, low quality


生成結果は下図です。こちらはプロンプト通りになります。自転車はロードバイクスタイルのものが描画されます。

Anima 1.0 base

Animaの画像生成結果、SDXL(Illustrious)との比較:画像33
Animaの画像生成結果、SDXL(Illustrious)との比較:画像34
Animaの画像生成結果、SDXL(Illustrious)との比較:画像35
Animaの画像生成結果、SDXL(Illustrious)との比較:画像36

Anima Preview 3

Animaの画像生成結果、SDXL(Illustrious)との比較:画像37
Animaの画像生成結果、SDXL(Illustrious)との比較:画像38
Animaの画像生成結果、SDXL(Illustrious)との比較:画像39
Animaの画像生成結果、SDXL(Illustrious)との比較:画像40

Anima Preview 2

Animaの画像生成結果、SDXL(Illustrious)との比較:画像41
Animaの画像生成結果、SDXL(Illustrious)との比較:画像42
Animaの画像生成結果、SDXL(Illustrious)との比較:画像43
Animaの画像生成結果、SDXL(Illustrious)との比較:画像44

Anima Preview 1

Animaの画像生成結果、SDXL(Illustrious)との比較:画像45
Animaの画像生成結果、SDXL(Illustrious)との比較:画像46
Animaの画像生成結果、SDXL(Illustrious)との比較:画像47
Animaの画像生成結果、SDXL(Illustrious)との比較:画像48

出力解像度

出力する画像の解像度は以下が推奨されています。

正方形

  • 1024x1024

縦長

  • 896x1152
  • 832x1216
  • 768x1344
  • 640x1536

横長

  • 1152x896
  • 1216x832
  • 1344x768
  • 1536x640
メモ
Illustrious (SDXL)のモデルの最適な解像度より解像度を下げたほうが品質が良くなる印象です。

品質が低い場合の対処法 : scoreタグ

Stable Diffusion XL (SDXL)のPonyモデルと同様にスコアタグを記述したほうが品質が良くなる傾向です。

品質タグは以下が学習されています。

Illustrious, Animagine系の品質タグ

  • masterpiece
  • best quality
  • good quality
  • normal quality
  • low quality
  • worst quality

Pony系の品質タグ

  • score_9
  • score_8
  • score_7
  • score_6
  • score_5
  • score_4
  • score_3
  • score_2
  • score_1


両方のタグを組み合わせて入力したほうが品質が上がります。片方だけでは品質があまり上がらない場合があります。
以下のタグをプロンプトに含めます。

Prompt
masterpiece, best quality, score_9, score_8
Negative prompt
worst quality, low quality, score_1, score_2, score_3


別パターン

Prompt
masterpiece, best quality, score_9, score_8, highres, absurdres
Negative prompt
worst quality, low quality, score_1, score_2, score_3, blurry, jpeg artifacts, lowres


出力例

Prompt
Prompt: 1girl, dynamic posing, white dress, full body, blue long sash,Silver gauntlets, anime coloring style, masterpiece, best quality, score_9, score_8
Negative prompt: worst quality, low quality, score_1, score_2, score_3

Model:Anima 1.0 Base

Animaの画像生成結果、SDXL(Illustrious)との比較:画像49
Animaの画像生成結果、SDXL(Illustrious)との比較:画像50
Animaの画像生成結果、SDXL(Illustrious)との比較:画像51
Animaの画像生成結果、SDXL(Illustrious)との比較:画像52

Preview3

Animaの画像生成結果、SDXL(Illustrious)との比較:画像53
Animaの画像生成結果、SDXL(Illustrious)との比較:画像54
Animaの画像生成結果、SDXL(Illustrious)との比較:画像55
Animaの画像生成結果、SDXL(Illustrious)との比較:画像56

Preview2

Animaの画像生成結果、SDXL(Illustrious)との比較:画像57
Animaの画像生成結果、SDXL(Illustrious)との比較:画像58
Animaの画像生成結果、SDXL(Illustrious)との比較:画像59
Animaの画像生成結果、SDXL(Illustrious)との比較:画像60


scoreタグが無い場合の結果です。

Prompt
Prompt: 1girl, dynamic posing, white dress, full body, blue long sash,Silver gauntlets, anime coloring style, masterpiece, best quality
Negative prompt: worst quality, low quality


画像生成結果は下図です。アニメ感の強い画像が生成されます。品質も下がる印象です。

Model:Anima 1.0 Base

Animaの画像生成結果、SDXL(Illustrious)との比較:画像61
Animaの画像生成結果、SDXL(Illustrious)との比較:画像62
Animaの画像生成結果、SDXL(Illustrious)との比較:画像63
Animaの画像生成結果、SDXL(Illustrious)との比較:画像64


ネガティブプロンプトのみscoreタグを入れた場合の結果です。

Prompt
Prompt: 1girl, dynamic posing, white dress, full body, blue long sash,Silver gauntlets, anime coloring style, masterpiece, best quality
Negative prompt: worst quality, low quality, score_1, score_2, score_3


画像生成結果は下図です。グラデーション表現の無いアニメ感の強い画像が生成されます。 スコアタグがネガティブプロンプトにない場合と比べると、品質は良くなる印象です。

Model:Anima 1.0 Base

Animaの画像生成結果、SDXL(Illustrious)との比較:画像65
Animaの画像生成結果、SDXL(Illustrious)との比較:画像66
Animaの画像生成結果、SDXL(Illustrious)との比較:画像67
Animaの画像生成結果、SDXL(Illustrious)との比較:画像68


プロンプトのみscoreタグを入れた場合の結果です。

Prompt
Prompt: 1girl, dynamic posing, white dress, full body, blue long sash,Silver gauntlets, anime coloring style, masterpiece, best quality, score_9, score_8
Negative prompt: worst quality, low quality


生成画像は下図です。アニメ感は弱まりますが、品質は少し劣るような印象があります。

Model:Anima 1.0 Base

Animaの画像生成結果、SDXL(Illustrious)との比較:画像69
Animaの画像生成結果、SDXL(Illustrious)との比較:画像70
Animaの画像生成結果、SDXL(Illustrious)との比較:画像71
Animaの画像生成結果、SDXL(Illustrious)との比較:画像72

どういうことなのか

イラスト系の画像はスコアタグがありで学習され、アニメの画像をスコアタグなしで学習したのではと推測されます。 スコアタグが無い場合は、スコアタグの無いアニメ系の画像が優位になり、アニメらしい画像が生成されます。 ネガティブタグにスコアを入れると、品質の低い画像が出にくくなるため、アニメらしい画像で品質が上がります。 プロンプトにスコアタグを入れると、イラスト系の画像が優位になり、グラデーションで塗られた画像が生成される動作になっているのではと推測できます。

SDXL(Illustrious)と比較して優れている点

SDXL(Illustrious)と比較した場合、出力される画像の品質は比較的似ていますが、以下の点において優れています。

プロンプト追従

現実的にはあり得ない構図やシーンのプロンプトの反映がSDXLより追従します。 ただし、Z Imageほどは追従しない印象です。また、題材によってはプロンプトに追従しない場合もあります。
また、一部のタグについてはIllustriousモデルのほうが反応が良く、Animaでは反応が悪いものがあります。

指定した語句が別の部分に反映されにくい (染み出しの低減)

長いプロンプトや複数キャラクターが画面に存在する場合、プロンプト内の語句が別の部分に影響を与えてしまうことがあります。 例えば「赤い帽子の女性と青いドレスの女性」と指定しても、色が混ざってしまうようなケースです。
SDXLのテキストエンコーダー(CLIP)は77トークンの制限があり、文の構造や修飾関係の理解に限界があるため、 このような染み出しが起きやすい傾向があります。 Animaが採用しているテキストエンコーダー(Qwen3 0.6Bベース)はLLM由来のため、より長い文脈を扱うことができ、 「どの記述がどの対象に対応するか」という構造の理解に優れています。そのため、プロンプト内で指定した語句が他の部分に反映されることが少なくなっています。
詳しくはこちらの記事を参照してください。

アーティストタグ追従

Animaではアーティストタグは @(アーティストタグ) の書式で記述できます。タグによっては効果が微妙なものもありますが、多くのタグで効果が非常に出やすいです。

風景などの非人物画像

ベースの知識が豊富なためか、風景やキャラクターのいないシーンの描写力が高い印象です。

比較1

風景画像での比較をします。

Animaでの画像出力です。プロンプトの指示に良く従った画像が生成されます。構図のバランスも良いです。

Prompt
Propt: Panoramic view of the fantasy like europe frorence city, distant view, cloudy weather, grass in the foreground, wide view scene, dramatic lighting, anime style realistic image., no human, A narrow winding river flows through the center of the city far away, masterpiece, best_quality, score_9, score_8
Negative prompt: worst quality, low quality,score_1, score_2, score_3, blurry, jpeg artifacts, lowres

Model:Anima 1.0 Base

Animaの画像生成結果、SDXL(Illustrious)との比較:画像73
Animaの画像生成結果、SDXL(Illustrious)との比較:画像74
Animaの画像生成結果、SDXL(Illustrious)との比較:画像75
Animaの画像生成結果、SDXL(Illustrious)との比較:画像76

Model:Anima Preview 3

Animaの画像生成結果、SDXL(Illustrious)との比較:画像77
Animaの画像生成結果、SDXL(Illustrious)との比較:画像78
Animaの画像生成結果、SDXL(Illustrious)との比較:画像79
Animaの画像生成結果、SDXL(Illustrious)との比較:画像80

Model:Anima Preview 2

Animaの画像生成結果、SDXL(Illustrious)との比較:画像81
Animaの画像生成結果、SDXL(Illustrious)との比較:画像82
Animaの画像生成結果、SDXL(Illustrious)との比較:画像83
Animaの画像生成結果、SDXL(Illustrious)との比較:画像84


Prompt
Model: WAI-Illustrious v16.0
Propt: Panoramic view of the fantasy like europe frorence city, distant view, cloudy weather, grass in the foreground, wide view scene, dramatic lighting, anime style realistic image., no human, A narrow winding river flows through the center of the city far away, masterpiece, best quality
Negative prompt: worst quality, low quality

Illustrious系のSDXLモデルでの生成結果です。プロンプトのニュアンスが若干伝わっていない印象です。特に"europe frorence city" はほとんど反映されないです。 "wide view scene"の重みが強いためか、空の面積が大きい構図になっています。

Animaの画像生成結果、SDXL(Illustrious)との比較:画像85
Animaの画像生成結果、SDXL(Illustrious)との比較:画像86
Animaの画像生成結果、SDXL(Illustrious)との比較:画像87
Animaの画像生成結果、SDXL(Illustrious)との比較:画像88

SDXL(Illustrious)のほうが優れている点

逆にSDXLのほうが優れている点は以下があります。

一部のタグの理解度

Animaでは学習されていないタグがあり、反映されにくいものがあります。名称付きの制服などがあります。

仕上がり

いわゆるペインティングはSDXLモデルのほうが良い傾向です。反射、光沢、グラデーションの滑らかさなどです。 Animaモデルではややフラットで単調なペインティングになりがちな傾向があります。 初期のSDXLモデルではペインティングの仕上がりがそれほど良くなかったことを鑑みると、 SDXL/Illustrious 派生モデルモデルが良質な画像での学習が進んでいることが理由の一つだと考えられます。

絵柄、LoRAの豊富さ

絵柄のコントロールや特定シチュエーションでLoRAを利用する際の種類の豊富さはSDXL/Illustrious 派生モデルのほうが充実しています。

AuthorPortraitAlt
著者
iPentecのメインデザイナー
イタリア好き。Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。 最近は生成AIの画像生成の沼に沈んでいる。
作成日: 2026-02-03