Qwen-Image-Layered をインストールする

ロッゾ=コルン
質問: Qwen-Image-Layered
Qwen-Image-Layeredという画像を要素ごとに分離できるモデルが登場したと聞いた。どのような手順で使えるのか教えてほしい。

Qwen-Image-Layered のインストール手順を紹介します。

事前準備

ComfyUI のインストール

ComfyUIをインストールします。最新版である必要があります。 インストール手順はこちらの記事のPortable版のインストールを参照してください

手順

Qwen-Image-Layered をインストールする手順を紹介します。

Qwen-Image-Layered モデル

以下の HuggingFaceのHubから、Qwen-Image-Editのfp8のモデル qwen_image_layered_bf16.safetensors または qwen_image_layered_fp8mixed.safetensors をダウンロードします。


bf16モデルは40.9 GBありますので、VRAM容量の多いGPUを利用していれば選択肢に入ります。


ダウンロードしたモデルを次のディレクトリに配置します。

(ComfyUIの配置ディレクトリ)\models\diffusion_models\

または

(ComfyUIの配置ディレクトリ)\models\diffusion_models\qwen-image-layered\

テキストエンコーダー (fp8)

以下の HuggingFaceのHubから、Qwen-Imageのテキストエンコーダー qwen_2.5_vl_7b_fp8_scaled.safetensors をダウンロードします。(Qwen-Imageと同じです)


ダウンロードしたモデルを次のディレクトリに配置します。

(ComfyUIの配置ディレクトリ)\models\text_encoders\

または

(ComfyUIの配置ディレクトリ)\models\text_encoders\qwen-image\

VAE

以下の HuggingFaceのHubから、Qwen-ImageのVAE qwen_image_layered_vae.safetensors をダウンロードします。(Qwen-Imageと同じです)

ダウンロードしたモデルを次のディレクトリに配置します。

(ComfyUIの配置ディレクトリ)\models\vae\

または

(ComfyUIの配置ディレクトリ)\models\vae\qwen-image-layered\


ファイルの配置は以上です。

ワークフロー

ComfyUIを起動し、以下のワークフローを作成します。
ワークフローのJSONは以下からダウンロードできます。


[拡散モデルを読み込む]ノードのモデルには qwen-image-layered\qwen_image_layered_bf16.safetensors または qwen-image-layered\qwen_image_layered_fp8mixed.safetensors を 設定します。
[CLIPを読み込む]ノードのモデルには qwen-image\qwen_2.5_vl_7b_fp8_scaled.safetensors を設定します。
[VAEを読み込む]ノードのモデルには qwen-image-layered\qwen_image_layered_vae.safetensors を設定します。

Qwen-Image-Layered をインストールする:画像1

[画像を読み込む]ノードに入力画像を設定します。
Qwen-Image-Layered をインストールする:画像2

プロンプトはよくわからないので、いったん以下を入力します。

Prompt
Separating the character from the background.
プロンプトの補足
後ほど紹介しますが、このプロンプトは入力画像を表現するプロンプトを入力します。 キャラクターや他の要素で隠された部分を生成する際に、このプロンプトが利用されるようです。


ワークフローの補足
ワークフローはこちらからもダウンロードできますが、入れ子構造のワークフローのため注意が必要です。

生成結果

[実行する]ボタンをクリックして画像生成を実行します。

今回の入力画像は下図です。
Qwen-Image-Layered をインストールする:画像3

画像生成結果が右側の[画像を保存]ノードに表示されます。正方形で画像が生成されてしまっています。
Qwen-Image-Layered をインストールする:画像4

メモ
bf16モデルを利用した場合でも、メインメモリにオフロードされますが、RTX 5090 32GB VRAM で 180秒程度で処理できます。何度も試行錯誤する処理ではないため、許容できる処理時間かと思われます。

画像生成結果を確認します。4つの画像が保存されており、元画像と要素ごとに分離された3つの画像が保存されています。

Qwen-Image-Layered をインストールする:画像5
Qwen-Image-Layered をインストールする:画像6
Qwen-Image-Layered をインストールする:画像7
Qwen-Image-Layered をインストールする:画像8


画像サイズを入力画像のサイズと同じにして再度実行します。 [EmptyHunyuanLatentVideo]のノードの[幅]と[高さ]の値を入力画像のサイズと同じピクセル数に設定します。
Qwen-Image-Layered をインストールする:画像9

再度実行します。入力画像と同じサイズで生成できました。
背景でキャラクターに隠れた部分はあまりうまく生成できていませんが、この部分の生成に先に設定したプロンプトが使用されるのかもしれません。

Qwen-Image-Layered をインストールする:画像10

Qwen-Image-Layered をインストールする:画像11
Qwen-Image-Layered をインストールする:画像12
Qwen-Image-Layered をインストールする:画像13
Qwen-Image-Layered をインストールする:画像14


キャラクターの画像は背景が透過された状態で保存されています。緑で背景を塗りつぶしたものが下図です。 きれいに背景が抜けている状態です。

Qwen-Image-Layered をインストールする:画像15
Qwen-Image-Layered をインストールする:画像16


プロンプトを以下に変更して再度実行します。

Prompt
Anime style image, A close-up of the girl's face and upper body. A smiling girl. Protruding steel beams, a cityscape visible below, a high altitude, blue skies, a fantasy world, a sci-fi feel, a bird's-eye view of the scene. realistic background image.


結果は下図です。キャラクターに隠れた背景部分が若干まともになったような気が?

Qwen-Image-Layered をインストールする:画像17
Qwen-Image-Layered をインストールする:画像18
Qwen-Image-Layered をインストールする:画像19
Qwen-Image-Layered をインストールする:画像20

参考: ワークフローJSON

BiRefNet for background removal とどちらが性能が良いか

キャラクターが抜き出せることから、BiRefNet for background removalとどちらが性能が良いか比較してみます。
結果は下図です。

"Qwen-Image-Layered"では背景がきれいに抜けており、BiRefNetよりだいぶ良い結果であることがわかります。

Qwen-Image-Layered
Qwen-Image-Layered - Qwen-Image-Layered をインストールする:画像21
BiRefNet General
BiRefNet General - Qwen-Image-Layered をインストールする:画像22
BiRefNet Matting
BiRefNet Matting - Qwen-Image-Layered をインストールする:画像23
Qwen-Image-Layered
Qwen-Image-Layered - Qwen-Image-Layered をインストールする:画像24
BiRefNet General
BiRefNet General - Qwen-Image-Layered をインストールする:画像25
BiRefNet Matting
BiRefNet Matting - Qwen-Image-Layered をインストールする:画像26
AuthorPortraitAlt
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。 最近は生成AIの画像生成の沼に沈んでいる。
作成日: 2025-12-30