Google ImageFX を利用して画像を生成する
Google ImageFX を利用して画像を生成する手順を紹介します。
概要
Googleから新しい画像生成サービス Google ImageFX がリリースされました。
他の画像生成サービスよりプロンプト追従性が高いとのことで、画像生成をして他の画像生成サービスとの結果を比較します。
手順
Google ImageFXのページ (https://labs.google/fx/tools/image-fx) にアクセスします。
下図のページが表示されます。[Sign in with Google]ボタンをクリックします。

下図の画面が表示されます。[Sign in]ボタンをクリックします。

Google アカウントのログイン画面が表示されますのでサインインします。
サインインできると下図の画面gな表示されます。[次へ]ボタンをクリックします。

下図のプライバシーポリシーの確認画面が表示されます。

プライバシーポリシーの最下部までスクロールします。スクロールすると[次へ]ボタンば有効になりますのでクリックします。

利用規約のダイアログが表示されます。[同意して続行]ボタンをクリックします。

ImageFXの下図の画面が表示されます。

左上のテキストボックスに画像生成のプロンプトを入力します。
今回は以下のプロンプトを入力します。入力ができたらテキストボックス右下の[作成]ボタンをクリックします。
Prompt
future city design, glass curtain wall building

画像生成が始まります。

生成された画像が右側に表示されます。

他の画像生成との比較
他の画像生成サービスと比較します。
今回は以下のプロンプトを利用します。キャラクターではない題材(タンク車と操車場)での画像生成で比較します。
Prompt
freight train, liquefied natural gas containers, train marshalling yard, wide scene, anime background style
Prompt:SDXLの場合
freight train, liquefied natural gas containers, train marshalling yard, wide scene, anime background style, masterpiece, best quality
Negative prompt: worst quality, low quality
ImageFX
タンク車が表現できています。操車場の風景は若干弱い印象です。アニメ的な画像の出力もできており、プロンプトの追従度は高いです。
若干形状に怪しい部分がありますが、線路の幅や線路の交差部分などかなり精度の高い描画ができています。
DALL・E3
タンク車、操車場の風景が表現されています。ややイラスト感が強い印象もあり、鮮やかな画像出力となっています。
Niji・Journey v6
タンク車は出力できています。操車場感は若干弱い印象がありますがある程度表現できています。カラーリングや構図のバランスが良く、いい感じの画像が生成できています。
MidJourney v6.1
タンク車は出力できています。操車場感は若干弱い印象がありますがある程度表現できています。カラーリングや構図のバランスが良く、いい感じの画像が生成できています。
FLUX.1 dev
タンク車が表現できていますが、操車場の風景は弱いです。
FLEX.1 Alpha
タンク車は稀に出力できていますが、多くは貨車になってしまいます。
Stable Diffusion 3.5
タンク車は出力できていますが、操車場感は若干弱い印象があります。
Noob AI XL v1.1
Illustrious系の, NoobAIのモデルです。キャラクターには強いモデルですが、
タンク車、操車場どちらの出力も無く電車の出力になっており、非キャラクターのプロンプト追従は弱い印象です。
Obsession v3.1
キャラクターには強いモデルですが、タンク車、操車場どちらの出力も無く、電車の出力になっており、非キャラクターのプロンプト追従は弱い印象です。
Kohaku XL Zeta
Illustrious, NoobAI の元となったモデルです。タンク車と操車場の風景は出力されますが、学習があまりされていないためか、形状が弱い印象です。
Animagine v3.1
Animagine v3.0
タンク車は出力されます、形状が若干怪しいものがあります。操車場の風景もある程度反映されています。
FiaMix v4.7
タンク車は出力されますが、線路の幅やタンクの形状など、形状が若干怪しいものがあります。操車場の風景はある程度反映されています。
OOO v8.0
AnimagineXL系の新しいモデルです。タンク車と操車場感どちらも表現されています。線路の幅なども若干怪しい部分はありますが、まずまずの精度で描画できています。
Animagine v4.0
タンク車は出力されますが、出力頻度は低めです。操車場感はかなり表現できています。絵としての見栄えは良いですが、構造的な正しさはあまり無い出力です。
まとめ
ImageFXの生成画像はプロンプトの追従も良く、論理的な正しさ(線路の幅など)も良い精度で画像が生成できています。
生成画像の構図やカラーリングは、写真的で標準的な印象です。
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。
最近は生成AIの画像生成の沼に沈んでいる。