「DALL-E3」で画像のIDを取得しIDベースで画像を修正
自然言語でChatGPTが補助しながら画像を生成してくれるDALL-E3かなり精度が良く、画像の修正も自然言語でのやりとりで置こうことが可能ですが、生成される画像は複数あり、画像を右・左や何番目の画像といったように指定することがありますが、今回は生成された画像のIDを取得し、IDベースで画像の修正などを行う方法です。
DALL-E 3 とは?
DALL-E 3はOpenAI社が開発公開した画像生成AIで、自然言語のやりとりで画像生成を行うことが可能です。現在はChatGPTのPlusとEnterpriseの2つの有料プラン、またはMicrosoft BingのImage Creatorにて利用することが可能です。
その他の画像生成AIとの大きな違いは、ChatGPTとの統合と、プロンプトの理解力となり、曖昧に投げた指示もChatGPTが的確にプロンプト化して投げることで、想像に近い画像を生成することが可能です。
IDの取得について
IDを取得するには、最初の画像生成時に依頼する必要があります。以下のようなプロンプトでDALL-E3に依頼します。
かわいい猫を生成してください。
それぞれの画像のIDも合わせて提示してください。
上記のスクリーンショットのように画像IDが示させれます。
IDを指定して画像を修正
ID:oVK79gJlwRv9mvY5 を黒猫にしてください。
修正された画像は以下。
IDの活用方法
画像のIDを取得することで、明確に画像を指定することができ、またしばらくして画像を改めて指定したい場合にはとても便利です。毎回入れ込むくせにしても良いぐらい、公式にも標準で実装して欲しい機能です。