画像生成 タグ・キャプション 作成記事

画像生成 タグ・キャプション 作成のインデックスページです。

タグの生成

タグとは画像を説明する、カンマで区切られた単語のテキストのことです。

1girl, solo, long_hair, looking_at_viewer, blush, open_mouth, simple_background, brown_hair, white_background, dress, bow


画像からタグを生成する方法には複数ありますが、ここでは、WD14Taggerと呼ばれる手法を利用する方法を紹介します。

キャプションの生成

キャプションとは以下のような画像に対する説明文のことです。

an anime girl in a pink sweater and black stockings


画像からキャプションを生成する方法にはいろいろな方式がありますが、ここでは BLIP/BLIP-2 と呼ばれる手法を利用する手順を紹介します。

ファイル生成

作成したタグやキャプションはそのまま利用する方法もありますが、加工やクリーニングが必要な場合もあります。
タグ、キャプションファイルの配置方法は大きく分けて、以下の2種類があります。

画像と同名のテキストファイルを配置する

image01.png のタグ、キャプションを image01.txt ファイルとして同じディレクトリに配置する方法です。

1つのJSONファイルにまとめて配置する

image01.png image02.png image03.png のように複数の画像ファイルがある場合、各ファイルのタグやキャプションをJSON1ファイルにまとめて記述する方法です。

キャプションとタグファイルをまとめてJSONファイルにする手順は以下の記事で紹介しています。

画像生成 タグ・キャプション 作成 のページ

Copyright © 1995–2025 iPentec all rights reserverd.