指鉄砲のポーズのプロンプトの紹介です。
指で鉄砲を撃つポーズをする画像のプロンプトを試します。
指鉄砲のプロンプトは次のプロンプトで生成できます。
finger pistolでも生成できますが、若干成功率は下がる印象です。
以下のプロンプトで画像を生成します。
結果は下図です。それらしいポーズにはなりますが、手の崩れが顕著です。
もっと画面側に人差し指(銃口)を向けてもらいたいので、以下のプロンプトに変更して生成します。
生成結果は下図です。手の崩れがあることと、人差し指だけで指すポーズになっている画像もあります。
niji・journeyでの生成結果も確認します。
生成結果は下図です。指鉄砲にならないです。
ControlNet Sketchを利用して、外形を与えて画像生成します。
下図の画像を準備します。
ControlNetに画像を設定します。Preprocessorに "scribble_hed"を設定し、ControlNetのModelには "t2i-adapter_xl_sketch" を選択します。
Control Weightを0.7に設定します。
プロンプトは以下を利用します。
画像を生成します。先の結果より手指の描画が改善できています。
パラメータを変化させて結果の良い場所を見つけます。
Control Weightを0.65に下げ、Ending Contorl Stepを0.9にします。
生成結果は下図です。
Preprocessor Resolutionを1024に変更し、Control Weightを0.75に設定しEnding Contorl Stepを0.9にします。
生成結果は下図です。手指が崩れる場合はありますが、良さそうな結果も生成できています。
指鉄砲のポーズのキャラクターを生成できました。
完成画像をP(プロデューサー)が確認したところ、以下のコメントがありましたので、指2本の指鉄砲ポーズを検討することにしました。
まず、プロンプトのみで対応できるか確認します。次のプロンプトで画像を生成します。
生成結果は下図です。手の崩れが大きくプロンプトのみでは意図した結果になりませんでした。
続いてControlNetのSketchを利用します。入力画像は下図を用意しました。
設定は下図です。
プロンプトは以下を利用します。Stepごとに画像が大きく変わらないancestral ではないアルゴリズムを選択します。
生成結果は下図です。指が6本になってしまう場合や、崩れてしまう場合も多く、成功率が極端に低くなります。
おそらく指2本の指鉄砲の学習があまりされていないことが原因かと考えられます。
モデルによってはやや成功率の高いものもあります。
生成画像をペイントソフトで修正し、再度img2imgをDenoising strength 0.4で弱めに再生成した画像が下図です。おおむねイメージ通りの画像が生成できました。