DALL-E 3のシード値を特定してイラストを再現する
画像生成AIを利用して生成する際に、多くのサービスやシステムで利用されているシード値。画像制御要素の一つで、同じプロンプトでもシード値を変えることで異なるイラストを生成できたり、逆にシード値を固定することで、イラストを再現することが可能です。
今回はDALL-E 3でのシード値の取得方法からシード値を固定して生成する方法などを試してみました。
DALL-E 3 とは?
DALL-E 3はOpenAI社が開発公開した画像生成AIで、自然言語のやりとりで画像生成を行うことが可能です。現在はChatGPTのPlusとEnterpriseの2つの有料プラン、またはMicrosoft BingのImage Creatorにて利用することが可能です。
その他の画像生成AIとの大きな違いは、ChatGPTとの統合と、プロンプトの理解力となり、曖昧に投げた指示もChatGPTが的確にプロンプト化して投げることで、想像に近い画像を生成することが可能です。
シード値の取得
シード値はイラストレーションの詳細画面を見ても記載されていないため、DALL-E 3の場合、自然言語で質問して取得します。
シード値を利用したイラストの再現
別のチャットを立ち上げて、コピーしたプロンプトと合わせてシード値を指定し画像生成を行ってみます。
別のチャットですが見事に再現することができました。
シード値の範囲は?
ChatGPTに確認したところ、OpenAIが公式に明確に発表している情報は無いとのことですが、一般的には、シード値は32ビットまたは64ビットの整数として扱われることが多いです。したがって、通常は32ビットの場合、0から4,294,967,295までの範囲、64ビットの場合、0から18,446,744,073,709,551,615までの範囲の整数をシード値として使用することができるとのことでした。
32ビットの最大の「4294967295」で生成
64ビットの最大値「18446744073709551615」で生成
結果は範囲を超えるということで生成できませんでした。
プロントと合わせてシード値も記録
再現したいイラストはプロントと合わせてシード値も記録しておいたほうが良いかもしれません。シードも指定は可能なので、一つずつずらして生成とか、そういった使い方も良いかもしれません。
きちんと理解してベースの性能の良いDALL-E 3をさらに使いこなしていけるようになりましょう。