親指、人差し指、中指の3本指を立てたピースサインの画像を生成するプロンプトの検証と紹介をします。
2025年にリリースされたモデルの場合には、プロンプトのみで実現できるモデルもあります。
成功率の低いモデルもあるため、繰り返し生成の必要があります。
以下のプロンプトで生成結果を確認します。
生成結果は下図です。
Animagine v4 は低頻度ですがうまく生成できる場合があります。Illustrious系のモデル、T-illunai3 では比較的高い頻度で3本指のピースサインが生成できています。
生成結果は下図です。"three finger salute"の場合は、3本指を立てた手が額の位置になるケースが多く、
敬礼に近いポーズになります。成功頻度もやや低めです。
親指、人差し指、中指の3本指を立てたハンドサインは次のワードで表現できます。
Three-Finger salute
または
three finger salute
salute のみを設定した場合は、手を開いて水平にしておでこの位置で敬礼する画像が生成できます。
以下のプロンプトで画像生成をします。
結果は下図です。人差し指と中指のピースサイン、親指と人差し指のピースサインの割合が多く、3本指のサインは低頻度でしか生成されません。
下図では、2つ程度しか生成されていません。
生成回数を増やして、イメージに近い画像が出力されるまで続ける方法で対応できますが、生成される頻度が低いためやや大変です。
手の形状とAnyTestを利用する方法です。
下図の手の形状の線画を準備します。親指、人差し指、中指の3本指を立てたサインの画像です。
準備した画像をControlNetの入力画像に設定します。Preprocessorは"none"に設定し、Modelを"CN-anytest_v4-marged [4bb64990]"を選択します。
AnyTestモデルについてはこちらの記事を参照してください。
Weightは1、Starting Control Stepは0、Ending Control Stepは1 とします。
ControlNetを有効にして、以下のプロンプトで画像を生成します。
結果は下図です。手の形状は固定されるため、崩れる場合もありますが、3本指を立てたサインの画像が生成されます。
ただし、手と体が整合性をもってつながらない画像が生成されてしまう場合もあり、崩れてしまう画像も生成されますが、プロンプトのみの結果より成功確率は上がります。
キャラクター全体の外形のアウトラインの線画を利用して画像を生成する方法です。
下図の画像を作成します。キャラクターのアウトラインの画像です。手の部分は。親指、人差し指、中指の3本指を立てたサインの形状を作画します。
準備した画像をControlNetの入力画像に設定します。Preprocessorは"lineart_realistic"に設定し、Modelを"ontrol-lora-canny-rank256.safetensors [ec2dbbe4]"を選択します。
モデルについてはこちらの記事を参照してください。
Weightは1、Starting Control Stepは0、Ending Control Stepは1 とします。
ControlNetを有効にして、以下のプロンプトで画像を生成します。
結果は下図です。手の形状と体のアウトラインは固定されるため、意図した形状での画像が生成できます。
一方で、生成画像のバリエーションや変化は少ないです。ContorlNetの入力画像の線画には目や口を描画していないため、表情や目の形状の違いはあります。
親指、人差し指、中指の3本指を立てたサインの画像を生成できました。