新しいモデルでの画像生成結果の比較をします。
非常階段に3人が座っている画像を生成して比較します。以下のプロンプトを利用します。
画像生成結果は以下です。
プロンプト通りの画像が生成できています。バリエーションは多様ですが、微妙な生成結果も多いです。ややロングショット気味の構図です。
プロンプト通りの画像が生成できています。キャラクターにフォーカスした構図になります。構図のバリエーションはやや狭い印象です。
ちょっと階段が錆びすぎているのではとの印象もあります。
"japanese school"がうまく反映できていない印象です。SF的な画像生成結果になる印象です。
プロンプト通りの画像が生成できています。バリエーションの幅は狭めです。
階段にキャラクターが座った画像は生成できていますが、非常階段や"japanese school"が理解できていない印象です。
"on the fifth floor"がうまく反映できていない印象です。地面に近い場所に座ってしまっています。構図のバリエーションは狭い印象です。
アニメ的な絵は弱い印象です。背景がリアリスティックな表現となっています。こちらも"on the fifth floor"がうまく反映できていない印象です。構図のバリエーションは狭い印象です。
Seedream v4はプロンプト追従も良く、キャラクターにフォーカスした構図で崩れにくく、評判が良いのも理解できる結果です。若干構図のバリエーションが狭い印象はあります。
nano bananaはロングショット気味ですが、プロンプトの内容が正しく反映されており、こちらも良好な結果でした。
特にバリエーションが豊富で、本を読んだりお弁当を食べたりするキャラクターの行動が描写されている点は非常に良いです。
Qwen-Image, Hunyuan Imageは一部の要素が反映されない結果となりましたが、多くの要素は生成画像に反映された結果となりました。
やや構図やデザインのバリエーションが狭い印象はあります。
貨物列車の操車場のガスタンク車を表現します。以下のプロンプトで画像生成します。
画像生成結果は以下です。
プロンプト通りに操車場感、ガスタンク車が表現できています。"low angle" については反映される場合とされない場合があります。
プロンプト通りに操車場感、ガスタンク車が表現できています。"low angle" については反映される場合とされない場合があります。
ガスタンク車や貨車の錆びや汚れの表現が強い印象です。リアリティはありますが、もう少しきれいな結果も出てきてよいかなと思いました。
生成画像のバリエーションはやや狭い印象です。
操車場感、ローアングル、ガスタンク車は表現できているものが多いです。"realistic"の指定がありますが、絵画的な仕上げの画像も生成されます。構図や美的な美しさは高い印象です。
プロンプト通りの画像が生成できています。バリエーションの幅は狭めです。
操車場感は出ています。"low angle"があまり反映されない結果となりました。
ものすごい大きなガスタンク車が生成されたりするなど、スケール感があっていないものもあります。
操車場感、ローアングル、ガスタンク車は表現できています。若干のっぺりした画像が生成される印象があります。バリエーションはだいぶ狭い印象です。
ローアングル、ガスタンク車は表現できています。やややフラット感のある画像が生成される印象があります。バリエーションは狭い印象です。
どのモデルにおいてもプロンプト追従も良く、指定通りの画像が生成できています。
Qwen-Image,Hunyuan Imageは画像生成結果が若干フラットになる印象です。構図の良さはMidjourneyが若干他のモデルより良い印象です。