画像生成AI「DALL-E 3」の画角の変更と画質のアップスケールについて解説
先日「ChatGPTに統合された「DALL-E 3」の基本的な利用方法のまとめ」という記事で、「DALL-E 3」の基本的な使い方を解説しましたが、今回は画角の変更と画質のアップスケールについて解説します。
DALL-E 3 とは?
DALL-E 3はOpenAI社が開発公開した画像生成AIで、自然言語のやりとりで画像生成を行うことが可能です。現在はChatGPTのPlusとEnterpriseの2つの有料プラン、またはMicrosoft BingのImage Creatorにて利用することが可能です。
その他の画像生成AIとの大きな違いは、ChatGPTとの統合と、プロンプトの理解力となり、曖昧に投げた指示もChatGPTが的確にプロンプト化して投げることで、想像に近い画像を生成することが可能です。
DALL-E 3の画角は3パターン
生成できる画角は以下の3パターンとなっています。
・正方形 (Square) : 1024×1024
・横長 (Wide) : 1792×1024
・縦長 (Tall) : 1024×1792
基本的な解像度には対応していますが、シネマワイドの21:9などには対応していません。基本的に何も指示を出さなければ、1:1の画角となります。
生成後も画角変更は可能
1:1で画像を生成したあと、横長、縦長の画角に画像を指定して変更することが可能です。実際に生成した画像を指定して、それらの画角を変えた実例は以下。
正方形 (Square) : 1024×1024
横長 (Wide) : 1792×1024
縦長 (Tall) : 1024×1792
若干の服の柄や顔の微妙なニュアンスは少し影響があるものの、再生成後も雰囲気をほぼ変えずに生成できるのは良いですね。
アップスケールには対応していない
現段階でDALLE3は解像度のアップスケールはサポートしていません。アップスケールをするにはその他AIツールを利用する必要があるとのことでした。
今後もさらに進化していくと思われますのでこのあたりも対応可能になるかもしれませんね。期待の画像生成AIです。
※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。
生成AI・AIの導入・研修・DXの支援はtazikuへ
生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションDXAIから、ご相談・お問い合せください。