iPentec.com / Document / カテゴリ: 画像生成 / タグ: 画像生成 Stable Diffusion

画像の指定した位置にキャラクターを描画する

やりたいこと

下図の画像(背景画像)が用意されています。
画像の指定した位置にキャラクターを描画する:画像1

この画像の下図の位置(黄色で囲まれた部分)にキャラクターを描画したいです。
画像の指定した位置にキャラクターを描画する:画像2

inpaint を利用する

Stable Diffusion WebUI を表示し、[img2img]のタブをクリックして選択します。左側のエリアの[inpaint]のタブをクリックして選択します。下図の画面が表示されます。
画像の指定した位置にキャラクターを描画する:画像3

先に紹介した、背景画像をドラッグ&ドロップまたはファイル参照で読み込みます。
画像の指定した位置にキャラクターを描画する:画像4

キャラクターを描画したい位置でドラッグしてマスクを作成します。
画像の指定した位置にキャラクターを描画する:画像5

プロンプトを設定します。以下のプロンプトを利用します。

Prompt

Prompt: 1girl, standing, stand with legs apart, full body, wearing white armor , blue long skirt, hold one arm
Negative prompt: worst quality, low quality

画像の指定した位置にキャラクターを描画する:画像6

画像出力は、[Resize by]のタブを選択し、Scale を 1 に設定します。入力画像と同じサイズでの出力とします。
画像の指定した位置にキャラクターを描画する:画像7

画像を生成します。マスクした領域にキャラクターが描画できました。
画像の指定した位置にキャラクターを描画する:画像8

生成結果は下図です。キャラクターが描画される場合もありますが、キャラクターが描画されない場合もあります。また、描画が崩れてしまい、キャラクターの顔はほとんどわかりません。
モブキャラや背景にいるキャラクターであればこの方法で問題ありませんが、メインキャラクターの描画には不向きです。
画像の指定した位置にキャラクターを描画する:画像9

inpaint+ControlNet を利用する

成功率を上げるため、ControlNetを追加します。下図の下絵を準備します。入力する背景画像と同じサイズの画像を用意し、キャラクターを描画したい位置に輪郭線を描画しています。
画像の指定した位置にキャラクターを描画する:画像10

ControlNetの[Enable]チェックボックスをクリックしてチェックをつけます。 [Upload independent control image]のチェックボックスをクリックしてチェックをつけます。チェックをつけると上部に画像のアップロード枠が表示されますので、ドラッグ&ドロップかファイル選択で、先ほど用意した下絵の画像を読み込みます。読み込み後、Preprocessor を "t2ia_sketch_pidl" に設定しプリプロセッサを実行します。また、Modelに "t2i-adapter-xl-sketch"を設定します。(モデルハッシュ値 ff9b22fb)
また、Control Weight を0.5に設定します。

下図が画像を読み込み、プリプロセッサの処理を実行し、設定を完了した状態です。

画像の指定した位置にキャラクターを描画する:画像11

画像を生成します。画像生成結果は下図です。先ほどより成功率が高く、指定したエリアにキャラクターが描画されましたが、描画がつぶれてしまっている状況は変わりませんでした。
こちらの方法もモブキャラや背景にいるキャラクターであればこの方法で問題ありませんが、メインキャラクターの描画には不向きです。

画像の指定した位置にキャラクターを描画する:画像12

原因として考えられるのは、指定した領域の解像度が小さすぎるためうまく描画できない可能性があります。今回入力に用いた背景画像のサイズは、1,456x816 pixelでキャラクターを描画したい領域のサイズは　224x475 pixelのため、SDXLの描画出力の1024よりかなり小さいです。

出力の画像サイズを2倍にして実行結果を確認してみたいところですが、 Scaled by のScale を 2 に設定した場合、画像生成を実行するためには42GBのVRAMが必要なため、実行できませんでした。
RTX 6000 Adaを入手すれば、48GBのVRAMが利用できますが、現状では対処法は無い状況です。

別画像で生成して合成する

先の手順では意図した画像が作成できなかったため、別の方法を検討します。
キャラクターの画像を別途生成し、背景を抜き出してキャラクターのみを背景画像に合成する方法がありそうです。

以下のプロンプトで画像生成します。

Prompt

Prompt: best quality, very aesthetic, 1girl, standing, stand with legs apart, full body, wearing white light armor , blue long skirt, hold one arm, brown boots, dark gray background
Negative prompt: worst quality, low quality, helmet

生成結果は下図です。生成はできましたが、想定イメージと違います。
画像の指定した位置にキャラクターを描画する:画像13

ControlNetを有効にし、Scribbleで下図の画像を入力して生成します。
画像の指定した位置にキャラクターを描画する:画像14
画像の指定した位置にキャラクターを描画する:画像15

プロンプトは以下とします。

Prompt

Prompt: best quality, very aesthetic, (anime style:0.2), 1girl, standing, (legs apart:1.2), full body, from just front, wearing white light armor , blue long skirt, hold one arm, brown boots, dark gray background
Negative prompt: worst quality, low quality, helmet

生成結果は下図です。先の結果とあまり変わり映えがしません。
画像の指定した位置にキャラクターを描画する:画像16

ControlNetをOffにしてプロンプトを検討します。試行錯誤の後、以下のプロンプトになりました。

Prompt

Prompt: best quality, very aesthetic,1girl, 14yo, standing, from front just, blue skirt, gray shirt, full body, bleeding arm, hold right one arm, legs apart, wearing white light armor ,gray background
Negative prompt: worst quality, low quality, helmet

生成結果は下図です。想定イメージに近くなりました。

画像の指定した位置にキャラクターを描画する:画像17

OpenPoseを導入します。OpenPose Editorで下図のポーズを作成します。
画像の指定した位置にキャラクターを描画する:画像18

[Sand to txt2img]ボタンをクリックし、txt2imgのControlNetの入力に設定します。 Preprocessorは"none"、Modelは"thibaud_OpenPoseXL2" (モデルハッシュ f4251cb4) を指定します。Control Weightは0.75に設定します。
画像の指定した位置にキャラクターを描画する:画像19

プロンプトを下記に変更します。

Prompt

Prompt: best quality, very aesthetic,1girl, 14yo, black hair, standing,look at forward, leaning forward, from front just, blue skirt, gray shirt, full body, bleeding arm, (hold one arm:1.2), legs apart, wearing white light armor ,gray boots, gray background
Negative prompt: worst quality, low quality, helmet

画像を生成します。生成結果は下図になります。
画像の指定した位置にキャラクターを描画する:画像20

こちらのイメージを採用としました。ABG Removerで背景を除去します。 ABG Removerについてはこちらの記事を参照してください。
画像の指定した位置にキャラクターを描画する:画像21

Photoshopで画像を合成します。カラーを調整して背景画像と合わせます。
画像の指定した位置にキャラクターを描画する:画像22
画像の指定した位置にキャラクターを描画する:画像23

背景とキャラクターを合成した画像が下図です。
画像の指定した位置にキャラクターを描画する:画像24

Tiled Diffusionでアップスケールします。VRAM不足のため、2倍にはアップスケールできないため、1.75倍にアップスケールします。画像が大きく変化しないようDenoising strengthを0.2に設定します。
画像の指定した位置にキャラクターを描画する:画像25

アップスケールした画像が以下です。
画像の指定した位置にキャラクターを描画する:画像26

著者

とりっち

iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。最近は生成AIの画像生成の沼に沈んでいる。

作成日: 2023-12-19

目次

画像の指定した位置にキャラクターを描画する

目次

やりたいこと

inpaint を利用する

inpaint+ControlNet を利用する

別画像で生成して合成する

関連するページ