• TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT
taziku
  • TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT

Stable Diffusion LoRAデータ作成 教師データ準備編

2023年5月1日
AI BLOG Technology
LoRA Stable Diffusion ジェネレーティブAI

前回、「Stable Diffusion LoRAデータ作成 sd-scriptsインストール編」でLoRAデータを学習できるツールのインストールするまでを紹介しましたが、今回は、LoRAデータ作成のための教師データの準備を行っていきます。

学習方式の選択

対応している学習形式は公式のRead meには以下の3つとなります。

DreamBooth、class+identifier方式(正則化画像使用可)

特定の単語 (identifier) に学習対象を紐づけるように学習。
キャプションを用意する必要が無いので、手軽ですが、髪型や服装、背景など学習データの全要素が identifier に紐づけられて学習生成時のプロンプトで服が変えられない、といった事態となります。

DreamBooth、キャプション方式(正則化画像使用可)

画像ごとにキャプションが記録されたテキストファイルを用意して学習。たとえば特定のキャラを学ばせると、画像の詳細をキャプションに記述することでキャラとそれ以外の要素が分離され、より厳密にモデルがキャラだけを学ぶことが期待できます。

fine tuning方式(正則化画像使用不可)

あらかじめキャプションをメタデータファイルにまとめます。タグとキャプションを分けて管理したり、学習を高速化するためlatentsを事前キャッシュしたりなどの機能をサポートします

今回は服装や髪型も変更できるようなLoRAデータを作成したいため、「2」のDreamBooth、キャプション方式(正則化画像使用可)を選択しました。

※正則化画像については例えば女性のキャラクターを学習しようとした場合、「girl」に紐付けられたて学習しますが、「girl」とプロンプトで選択した時「キャラクター」が出てきてしまうのを防ぐためのものとなります。

画像の準備

「sd-scripts」では、画像は全て指定形式でリサイズしてくれます。また背景が写り込んでいても問題がありません。png、jpg、jpeg、webp、bmpが利用可能ですので、学習したい内容ので画像データを集めましょう。この時集めたデータは連番にしておきましょう。

教師データ、正則化データ、アウトプット先のフォルダを作成
こちらについては、任意の名前「train_data(教師データ)」「seisoku_data(正則化データ)」「LoRAout(アウトプット先)」などを準備します。
日本語パスが入っていなければどこでも大丈夫です。sd-scriptsのインストールフォルダ無いにする必要はありません。

キャプションファイルの準備

こちらは画像に対応したキャプションデータを準備する必要があるのですが、手作業で準備しているとかなり手間な作業なため、Stable Diffusionの拡張機能を利用します。

いくつかありますが、今回はstable-diffusion-webui-wd14-taggerで進めていきます。URLをエクステンションタブのinstall from URLに以下のURLを貼り付けて「install」

https://github.com/toriato/stable-diffusion-webui-wd14-tagger

インストールが成功するとタブにTaggerというタブが出現するため、選択。さらにその中のBatch from directoryタブを選択して、「input directory」と「output directory」に教師データフォルダのパスを入力し、Additional tagsに、今回の学習データと紐付けたいタグを入力し「interogate」ボタンを押せば、画像データごとのキャプションファイルを出力してくれます。

キャプションファイルの編集

生成したキャプションファイルを編集していきます。「Additional tags」で設定したタグは残し、「学習させたい要素」を削除していきます。

ここで重要なのが、「学習させたく無い要素」では無く、「学習させたい要素」を消すという作業になります。直感的には逆にと捉えてしまいがちですが、「学習させたい要素」を消していきます。

最終キャプションには「紐付けたいキャプション」+「学習させたくない要素」となっているようにしましょう。

教師データのサンプルデータ

初見だと、上記構造・説明がわかりにくいので、直感的に分かりやすいデータサンプルが欲しいという方は、「東北ずん子・ずんだもんプロジェクト」さんが、AI画像生成のLoRAなどでキャラクターイラストを生成するために利用しやすい学習用データを配布してくれています。

以下URLの下段からダウンロードして構造を理解したり、試したりしてみてください。

https://zunko.jp/con_illust.html

キャプションデータも同封されています。

ここまでで教師データの準備は完了です。次はいよいよ実際に学習していきます。

※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。

Stable Diffusion 最新情報

tazikuでは画像生成AI Stable Diffusion(スティーブルディフュージョン)AUTOMATIC1111を中心に、最新情報、機能紹介、様々なTipsを発信中!Stable Diffusionに関するまとめ記事、記事一覧は以下のリンクからご覧ください。

Stable Diffusion関連記事まとめ

Stable Diffusion記事一覧

AIの最新情報を随時発信中

Xやnoteでは、AI・生成AI・LLMなどの最新情報や、ChatGPTやMidjourneyのプロンプトテクニックを連載中!フォローよろしくお願いします。

生成AI・AIの導入・研修・DXの支援はtazikuへ

生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションAI CREATIVE BASEから、ご相談・お問い合せください。

PREV Stable Diffusion LoRAデータ作成 sd-scriptsインストール編
NEXT Stable Diffusion LoRAデータ作成 学習実行編
Related Post
画像生成AIでSUV(車)をデザインする
プラグインを利用してChatGPTを拡張する<インストール〜実行まで>
手軽にStable Video Diffusion 1.1が利用できる「Stable Video」
画像生成AI「MidJourney」がv6にアップデート
Spatial (スペイシャル)有料プランでできることまとめ
ブログかnoteか?スタートアップ企業の情報発信戦術
Related Post
進化するMidjourney v7が描く次世代のAI画像生成
Claude 3.5の新機能 新モデル登場とPC操作機能
Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す
Claude 3 で画像をピクセル化するプログラムを生成
Claude 3で登場人物の会話を生成する
Claude 3 でXMLタグを利用する

« PREV

Back to list

NEXT »

  • 投稿検索

  • ABOUT US?

    tazikuは東京・名古屋を拠点に活動するクリエイティブスタジオです。
    AI・生成AI・LLMとクリエイティブを掛け合わせ、新しいクリエイティブを提供します。
    Works
    Service
    Contact
  • AI CREATIVE BASE

    デザイン、ビジュアル、音声、空間演出。生成AIでクリエイティブワークフローに革新を与え、ビジネスの成果を最大化します。

    詳細を見る

  • MENU

    • BLOG
      • Think
      • Creative
      • Technology
        • AI
        • メタバース
    • Project
      • AIアニメプロジェクト
      • どうくつたんけん
  • NEW POST

    • 進化するMidjourney v7が描く次世代のAI画像生成
    • Claude 3.5の新機能 新モデル登場とPC操作機能
    • Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す
    • Claude 3 で画像をピクセル化するプログラムを生成
    • Claude 3で登場人物の会話を生成する
© 2021 taziku / 株式会社タジク Based in Tokyo and Nagoya | プライバシーポリシー