キャラクターの画像を特定のシチューエーションに合わせられるか検証します。
今回はQwen-Image-Editを利用します。
Qwen-Image-Editをインストールします。手順はこちらの記事を参照してください。
ワークフローを作成または読み込みます。手順はこちらの記事を参照してください。
入力画像は下図を設定します。
[TextEncodeQwenImageEdit]のノードのプロンプトには以下を設定します。
椅子に座ったキャラクターの画像を生成します。
実行します。生成された画像が出力されます。
下図の画像が生成できました。イメージ通りの画像が生成できています。
ポーズは問題ないのですが、生成された画像のノイズがかなり目立ちます。そのまま利用するのは少し難しそうです。
なお、立っているキャラクターの画像を入力した場合の結果も確認します。
足が前に出た状態になると良いのですが、足はそのままの状態の結果となりました。
また、以下のプロンプトに変更して、手を上げる動作の変更を指示した場合の結果を確認します。
結果は下図です。手の指示を入れたことで、キャラクターが人体として判断されるらしく、足が変化しています。(足が少し長くなる)