「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果

「じゃーん!こちらです!」のポーズのプロンプトを検討して画像を生成します。

やりたいこと

今回P(プロデューサー)からの指定は下図のポーズです。
言葉で表現するのが難しいポーズで苦戦しそうです。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像1

完成イメージ

2025年2月版
2025年2月版 - 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像2

ControlNet Sketchを利用する

はじめにControl Sketchを利用して画像生成する方式を試します。
下図の入力画像を準備します。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像3

2025年の検証

ベースモデルの性能が向上しているため、ControlNet Scribble で意図した出力ができるようになりました。

ControlNetの入力画像に設定し、Preprocessor "scribble_pidinet", Model "t2i-adapter_xl_sketch" (モデルハッシュ:ff9b22fb)を設定し、画像生成します。
Control Weightは"0.5"、Ending Control Stepは"0.8"としています。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像4

プロンプトは以下を利用します。

Prompt
Prompt: 1girl, arm raised, arm outstretched, gray casual ware, upper body, black pants, simple background, look at viewer, masterpiece, best quality
Negative prompt: worst quality, low quality

生成結果は下図です。意図したものに近いポーズで生成できています。

animagine XL 4.0
animagine XL 4.0 - 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像5

T-illunai3 v6
T-illunai3 v6 - 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像6

2024年の検証

ControlNetの入力画像に設定し、Preprocessor "scribble_pidinet", Model "t2i-adapter_xl_sketch" (モデルハッシュ:ff9b22fb)を設定し、画像生成します。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像7

プロンプトは以下を利用します。

Prompt
Prompt:1girl, very aesthetic, arm raised, upper navel body, arm outstretched, gray shirt, black pants, simple background, look at viewer, show with arms
Negative prompt:worst quality, low quality

Animagine XL v3.1での生成結果は下図です。
8割以上は想定していたポーズと別のポーズになってしまいますが、低確率で意図したポーズの画像が生成されます。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像8 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像9

LizMix v6.0での生成結果です。LizMixのほうが狙ったポーズでの出力になりやすい印象です。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像10 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像11

7th Anime XL Aの生成結果です。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像12 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像13

7th Anime XL Bの生成結果です。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像14 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像15

BluePencil XL v6.0.0の生成結果です。低確率ですが、意図したポーズの出力があります。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像16 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像17

ControlNet OpenPoseを利用する

次に、ControlNet OpenPoseを利用します。OpenPose Editorを使用して下図のポーズを作成します。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像18

[Send to txt2img]ボタンをクリックし、ポーズをtxt2imgのControlNetの入力に設定します。 Preprocessorを"none"に設定し、Modelを"thibaud_OpenPoseXL2" (モデルハッシュ:f4251cb4)を指定します。

メモ
thibaud_OpenPoseXL2 は(https://huggingface.co/thibaud/controlnet-openpose-sdxl-1.0)から入手できます。

Control Weightは0.5まで下げます。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像19

プロンプトは以下を利用します。

Prompt
Prompt:1girl, very aesthetic, arm raised, upper navel body, arm outstretched, gray shirt, black pants, simple background, look at viewer, show with arms
Negative prompt:worst quality, low quality

LizMix v6.0での生成結果です。近いポーズは出力されますが、意図したポーズとは微妙に違います。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像20 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像21

PoseMy.ArtからDepthを出力し、ControlNet Depthを使用する

PoseMy.ArtからDepthを出力し、ControlNet Depthを使用する方法も試します。
PoseMy.Artでポーズをさぃせおそ。Depthをエクスポートします。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像22

下図のDepth画像を出力できました。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像23

ControlNetの入力画像にDepthの画像を設定します。Preprocessorに"none"を Modelに "diffusers_controlnet-zoe-depth-sdxl-1.0" (モデルハッシュ:edc9485c)を指定します。
Control Weightは0.5まで下げます。

「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像24

画像を生成します。生成結果は下図です。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像25

画像の生成はできましたが、ややポーズが固い印象があります。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像26

バリエーションの作成

3つの方法でポーズの画像を生成しましたが、生成画像を見比べた結果、 下図の画像を採用しました。ControlNet Sketchで作成した画像が採用になりました。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像27

生成した画像のシャツの色や髪色を変更します。カラーの変更には、ContorlNet Tileを利用します。
ControlNetの入力画像に採用した画像を設定します。Preprocessorに "tile_resample" を指定し、Modelに "TTPLANET_Controlnet_Tile_realistic_v2_fp16" (モデルハッシュ:c32b8550)を指定します。

メモ
TTPLANET_Controlnet_Tile_realistic_v2_fp16は(https://huggingface.co/TTPlanet/TTPLanet_SDXL_Controlnet_Tile_Realistic)から入手できます。

「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像28

以下のプロンプトで画像生成を実行します。

Prompt
Prompt:1girl, very aesthetic, yellow shirt, black pants, brown hair
Negative prompt:worst quality, low quality


生成結果は下図です。ポーズは変えずにカラーの変更ができました。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像29

下図の画像を採用します。手が不自然なので、修正します。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像30 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像31

修正した画像を img2img に入力します。img2imgのDenoising strengthは0.5に設定します。
ControlNet Lineartを利用します。Preprocessorに"lineart_standard (from white bg & black line)" を指定し、 Modelに"controlnetxlCNXL_tencentarcLineart" (モデルハッシュ:905c2459)を指定します。 Contorl Weightは0.5に設定します。

「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像32
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像33

生成結果は下図です。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像34

下図の画像を採用しました。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像35

最後にADetailerを適用して表情を変更して完成とします。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像36

別の衣装にする場合

別の衣装に変更する場合は、採用画像をControlNetの入力画像として、OpenPoseを利用します。 Preprocessorを"dw_openpose_full"、Modelを "thibaud_OpenPoseXL2" (モデルハッシュ:f4251cb4)を指定します。
「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像37

以下のプロンプトで画像生成します。ポーズや手が崩れてしまう場合もありますが、衣装を変更した画像を生成できます。

Prompt
Prompt:masterpiece, fantasy white costume, red hair,arm raised, upper body, arm outstretched
Negative prompt:worst quality, low quality, skin

「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像38

プロンプトのみでの表現

若干ポーズが異なりますが、モデルによっては以下のプロンプトが有効な場合があります。

Prompt
dramatic showcase pose
Prompt
vanna white pose


かなりの低頻度ですが、うまくいくと水平方向に腕を伸ばして紹介するポーズが生成できる場合があります。

Prompt
Prompt:1girl, dramatic showcase pose, casual ware, full body, masterpiece, best quality
Negative prompt: worst quality, low quality

T-illunai3 v6
T-illunai3 v6 - 「じゃーん!こちらです!」のポーズのプロンプト、画像生成結果:画像39

AuthorPortraitAlt
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。 最近は生成AIの画像生成の沼に沈んでいる。
作成日: 2023-06-30
改訂日: 2025-02-09
Copyright © 1995–2025 iPentec all rights reserverd.