ControlNet OpenPoseモデルによる出力の違い

1 概要
2 OpenPoseの準備
3 SDXL
- 3.1 出力結果
  - 3.1.1 OpenPoseなし
  - 3.1.2 bdsqlsz - Openpose
  - 3.1.3 kohya - OpenposeAnime
  - 3.1.4 kohya - OpenposeAnimeV2
  - 3.1.5 tencentarc - Openpose
  - 3.1.6 thibaud - Openpose
  - 3.1.7 thibauld - OpenposeLora
4 Stable Diffusion 1.5
- 4.1 出力結果
  - 4.1.1 OpenPoseなし
  - 4.1.2 control_v11p_sd15_openpose
  - 4.1.3 controlnetT2IAdapter_t2iAdapterOpenpose

Stable DiffusionのControlNet の OpenPoseモデルによる出力の違いを比較します。

概要

Stable DiffusionでContorlNetでOpenPoseを利用して画像の出力ができますが、OpenPoseには複数のモデルがあります。また、SDXLでは意図したような出力にならないこともあります。この記事では、OpenPoseのモデルごとの出力を比較し、どのような違があるかを調査します。

OpenPoseの準備

OpenPose Editorでポーズを作成します。今回は下図のポーズを作成します。OpenPoseの適用状況がわかるように、画面に右下にポーズをつけたキャラクターを配置しています。
ControlNet OpenPoseモデルによる出力の違い:画像1

ポーズの画像を保存します。

SDXL

txt2imgで、ControlNetに先ほど作成したOpenPoseのポーズ画像を読み込みます。
ControlNet OpenPoseモデルによる出力の違い:画像3

Modelを選択します。SDXLの代表的なOpenPoseのモデルは以下の6つがあります。

bdsqlsz - Openpose
kohya - OpenposeAnime
kohya - OpenposeAnimeV2
tencentarc - Openpose
thibaud - Openpose
thibauld - OpenposeLora

ControlNet OpenPoseモデルによる出力の違い:画像4

それぞれのモデルの出力結果を確認します。

プロンプトとモデルは以下を利用します。

Prompt

Prompt: 1girl, standing
Negative prompt: worst quality, low quality
Model: Animagine XL v3
Size: 1,024x1,024

ControlNet OpenPoseモデルによる出力の違い:画像6

出力結果

出力結果は下図です。

OpenPoseなし

ControlNetを無効にして、OpenPoseを利用しない場合の生成結果です。
ControlNet OpenPoseモデルによる出力の違い:画像7

bdsqlsz - Openpose

OpenPoseの設定がほとんど反映されていないように見えます。
ControlNet OpenPoseモデルによる出力の違い:画像8

kohya - OpenposeAnime

右下の形状がOpenPoseのポーズを若干反映しているように見えます。元の出力カラーより若干黄色みがかかります。
ControlNet OpenPoseモデルによる出力の違い:画像9

kohya - OpenposeAnimeV2

右下にOpenPoseのポーズを反映したキャラクターが生成される場合があります。キャラクターが生成されない場合は、ポーズに似たオブジェクトが生成される場合もあります。中央にもキャラクターが生成され2キャラになる場合もあります。元の出力カラーより若干黄色みがかかります。
ControlNet OpenPoseモデルによる出力の違い:画像10