Animagine XL v4.0 の画像サイズの違いによる生成画像の違いを比較します。
Animagine XL v4.0では以下の推奨サイズがあります。
推奨サイズでの画像生成結果を確認します。
向き | サイズ | 縦横比 |
---|---|---|
正方形 | 1024 x 1024 | 1:1 |
横長 | 1152 x 896 | 9:7 |
横長 | 1216 x 832 | 3:2 |
横長 | 1344 x 768 | 7:4 |
横長 | 1536 x 640 | 12:5 |
縦長 | 896 x 1152 | 7:9 |
縦長 | 832 x 1216 | 2:3 |
縦長 | 768 x 1344 | 4:7 |
縦長 | 640 x 1536 | 5:12 |
以下、出力画像の解像度の違いによる結果を比較します。
以下のプロンプトで画像を生成します。
正方形サイズの出力は特に問題ありません。
横長の場合も推奨サイズでは問題ありません。プロンプトの"fullbody"指定もあるため、横長になるほど背景の面積が多くなります。
縦長の場合は、縦長になるほどキャラクターの頭身が上がる傾向にあります。640×1536の場合は高身長なキャラクターが生成されるケースが多いです。
正方形サイズの出力は特に問題ありません。
横長の場合も推奨サイズでは問題ありません。プロンプトの"fullbody"指定もあるため、横長になるほど背景の面積が多くなります。
縦長の場合は、縦長になるほどキャラクターの頭身が上がる傾向にあります。640×1536の場合は高身長なキャラクターが生成されるケースが多いです。
正方形サイズの出力は特に問題ありません。
横長の場合も推奨サイズでは問題ありません。プロンプトの"fullbody"指定もあるため、横長になるほど背景の面積が多くなります。
縦長の場合は、縦長になるほどキャラクターの頭身が上がる傾向にあります。640×1536の場合は高身長なキャラクターが生成されるケースが多いです。
画像の縦横比を2:3に固定してサイズの違いで生成画像を比較します。
プロンプトは先の比較と同様です。
横幅256ピクセルではノイズになってしまい画像は生成できていません。512,600ピクセルでもノイズが多く出力としては問題があります。680ピクセル程度から許容できる出力になります。
横幅768ピクセル以上では問題なく出力できます。960ピクセル以上ではキャラクターの頭身がやや上がってしまう印象はあります。
またサイズが大きくなるほど、背景が精密になります。
横幅1080ピクセル以上では、キャラクターの頭身はかなり上がってしまいますが、プロンプトには従い、2人のキャラクターが表示されたりはしません。
また、キャラクターの体が崩れたりする現象も発生しません。ControlNetやimg2imgを利用すれば、頭身のコントロールもでき、実用上利用できる解像度だと考えられます。
背景の精密感は高いです。
横幅1366ピクセル以上では、キャラクターの崩れが目立ち始めます。背景の精密感や描写のダイナミック感は残りますので、
キャラクターの無い画像を出力する場合には大きな解像度を利用して生成するのはありかもしれません。
横幅256ピクセルではノイズになってしまい画像は生成できていません。512,600ピクセルでもノイズが多く出力としては問題があります。680ピクセル程度から許容できる出力になります。
横幅768ピクセル以上では問題なく出力できます。960ピクセル以上ではキャラクターの頭身がやや上がってしまう印象はあります。
またサイズが大きくなるほど、背景が精密になります。
横幅1080ピクセル以上では、キャラクターの頭身はかなり上がってしまいますが、プロンプトには従い、2人のキャラクターが表示されたりはしません。
また、キャラクターの体が崩れたりする現象も発生しません。ControlNetやimg2imgを利用すれば、頭身のコントロールもでき、実用上利用できる解像度だと考えられます。
背景の精密感は高いです。
横幅1366ピクセル以上では、キャラクターの崩れが目立ち始めます。背景の精密感や描写のダイナミック感は残りますので、
キャラクターの無い画像を出力する場合には大きな解像度を利用して生成するのはありかもしれません。
横幅256ピクセルではノイズになってしまい画像は生成できていません。512,600ピクセルでもノイズが多く出力としては問題があります。680ピクセル程度から許容できる出力になります。
横幅768ピクセル以上では問題なく出力できます。960ピクセル以上ではキャラクターの頭身がやや上がってしまう印象はあります。
またサイズが大きくなるほど、背景が精密になります。
横幅1080ピクセル以上では、キャラクターの頭身はかなり上がってしまいますが、プロンプトには従い、2人のキャラクターが表示されたりはしません。
また、キャラクターの体が崩れたりする現象も発生しません。ControlNetやimg2imgを利用すれば、頭身のコントロールもでき、実用上利用できる解像度だと考えられます。
背景の精密感は高いです。
横幅1366ピクセル以上では、キャラクターの崩れが目立ち始めます。背景の精密感や描写のダイナミック感は残りますので、
キャラクターの無い画像を出力する場合には大きな解像度を利用して生成するのはありかもしれません。