画像生成ジェネレーティブAI「DALL・E2」の始め方から画像生成までを解説
人工知能を研究する非営利団体OpenAI。「ChatGPTにメタバースについて、色々質問してきた」という記事でも取り上げた、対話型のAIチャットサービスChatGPTも有名ですが、今回はOpenAIが手掛けた、画像生成ジェネレーティブAI「DALL・E2」の始め方から、画像生成までを解説します。
DALL・E2の始め方
OpenAIのIDを取得
OpenAIは、サービスごとのIDではなく、OpenAI自体でアカウントを取得する形となっており、様々なAIサービスがOpenAIのIDを取得することで利用可能になります。
まずは右上のSIGN UPのボタンを押してアカウント生成画面に遷移。Emailアドレスもしくは、GoogleやMicrosoftアカウントでも連携してアカウントを作成可能です。
アカウントを作成後、ログインすると上記のページに遷移します。これで画像の生成準備は完了です。アカウントを生成すると最初に50クレジットが付与され、1回生成するごとに、クレジットが1消費されます。
DALL・E2で画像を生成
プロンプトを準備
まずは、スタンダードに、プロンプト(呪文)を入力して生成する方法から。操作方法は簡単でログイン後の画面の中央のテキストボックスに英文で指示を出すと、指示に沿った画像を生成してくれます。
例えば「クレイアニメ風の寝ている、かわいいロボット」を作成してみます。まずはこれを英文に訳します。
訳したプロンプト「Sleeping, cute robot in clay animation style」をフォームに入力し、Generateボタンをクリックすると生成が始まります。
生成された画像
カワイイかどうかは主観を挟むのでおいておいて、確かに、クレイアニメ風の寝ているカワイイロボットが4つ生成されました。生成された画像は選択してダウンロードが可能です。
生成した画像からバリエーションも生成も可能。
画像を選択した後に表示されるVariationsボタンを押すことで、選んだ一枚をベースにさらに派生した画像を生成することが可能です。
DALL・E2で画像をチューニングする
編集し画像を調整する
画像を選択後、Editボタンを押し、画像の一部を消して、テキストを追加して生成し直すことで、消されていない部分の画像は活かしつつ、異なるバリエーションを生成することが可能です。上記のように頭の部分を消して、追加でプロンプト「Sleeping on a pillow(まくらをつかって寝ている)」を入力。顔全体を指定しているので、顔も変わっていますが、体はそのままで枕で寝ているロボットが生成されました。
画像をアップロードして派生を創る
DALL・E2はプロンプトだけではなくて、自前の画像データをベースにし派生の画像を生成することも可能です。画像アップロードについてはアップの際に以下の3点が注意として提示されますので、規約には十分注意して画像をアップロードを行いましょう。
1.他人の権利を尊重しましょう。他人の写真を勝手にアップロードしないようにしましょう。
2.画像は、当社の安全ポリシーの実施および当社モデルの改善のために確認されることがあります。
3.私たちは、私たちのモデルを改善し、私たちのポリシーを実施するために、アップロードを含む、あなたのデータを使用することがあります。
試しに、過去使っていた自分の似顔絵をアップロードしてバリエーションを生成してみました。生成された画像は以下となります。細かいところはかなり雑ですが、テイストを守って画像が生成されています。
料金について
DALL・E2については、クレジット制の有料サービスです。クレジットはアカウントを作成時に50付与され、毎月15ずつ付与されます。現状は115クレジットで15ドルとなっており、特にボリュームディスカウントなどは行っていないようです。
商用利用など利用規約について
利用規約3のコンテンツ(a)によれば、DALL・E2で生成した画像は商用利用も許可されており、規約を遵守するかぎり、全ての、入力に対して出力されたコンテンツに対する、すべての権利、権原および利益をユーザーに譲渡するものとするとしており、入力者が権利を有する形になっているため、商用利用なども認められています。(2023年1月11日現在)
原文については変更もありうるため都度チェックは必要となりますが、現状は商用利用可能というスタンスはβ版リリースから変わっていません。
規約原文
- Content
(a) Your Content. You may provide input to the Services (“Input”), and receive output generated and returned by the Services based on the Input (“Output”). Input and Output are collectively “Content.” As between the parties and to the extent permitted by applicable law, you own all Input, and subject to your compliance with these Terms, OpenAI hereby assigns to you all its right, title and interest in and to Output. OpenAI may use Content as necessary to provide and maintain the Services, comply with applicable law, and enforce our policies. You are responsible for Content, including for ensuring that it does not violate any applicable law or these Terms.
クリエイターとしての向き合い方
ジェネレーティブAIについては、リリースされて時間が経過していないことから、様々な問題やトラブルが起きる可能性を内包していますが、そのまま利用する以外にもアイデアのインスピレーションとする、ラピッドプロトタイピングに利用するなど、様々な使い方ができると考えています。
AIといってもプロンプトやチューニングには、様々なクリエイティブツールと同じく習熟が必要となるため、いずれくるAI時代に合わせて習得しておくというのも、クリエイターにとっては必要ではないかと思っています。