画像生成 タグ・キャプション 作成のインデックスページです。
タグとは画像を説明する、カンマで区切られた単語のテキストのことです。
1girl, solo, long_hair, looking_at_viewer, blush, open_mouth, simple_background, brown_hair, white_background, dress, bow
画像からタグを生成する方法には複数ありますが、ここでは、WD14Taggerと呼ばれる手法を利用する方法を紹介します。
キャプションとは以下のような画像に対する説明文のことです。
an anime girl in a pink sweater and black stockings
画像からキャプションを生成する方法にはいろいろな方式がありますが、ここでは BLIP/BLIP-2 と呼ばれる手法を利用する手順を紹介します。
作成したタグやキャプションはそのまま利用する方法もありますが、加工やクリーニングが必要な場合もあります。
タグ、キャプションファイルの配置方法は大きく分けて、以下の2種類があります。
image01.png
のタグ、キャプションを image01.txt
ファイルとして同じディレクトリに配置する方法です。
image01.png
image02.png
image03.png
のように複数の画像ファイルがある場合、各ファイルのタグやキャプションをJSON1ファイルにまとめて記述する方法です。
キャプションとタグファイルをまとめてJSONファイルにする手順は以下の記事で紹介しています。