画像生成AIの新モデル「Stable Cascade」とは?
Stable Cascadeは、Stability AIがリリースしたWürstchenアーキテクチャをベースにした新しいテキスト画像変換モデル。
Würstchenアーキテクチャとは、Stage A~Cの3段階から構成されており、このステージ分けがおこなわれたことで、ユーザはモデルへの追加学習やLoRA学習を行う際、Stage Cのみを考えれば良く、学習コストがかなり軽減されます。
先行モデルとの比較
現状、Stability AIが発表した結果によると、Stable Cascadeは、ほぼすべてのモデルと比較しても優れていることがわかっているとのこと。
Stable Cascadeの機能
Stable Cascadeは準的なテキストから画像への生成に加え、画像バリエーションやImage-to-imageをより詳細に行うことが可能です。また、トレーニング、ファインチューニング、ControlNet、LoRAについても対応しています。
学習と推論コードをはStability AIのGitHubページで公開されていますが、現在このモデルは非商用利用のみを許可する非商用ライセンスの下でリリースされており、商用利用は不可となっています。
StableCascade
https://github.com/Stability-AI/StableCascade
※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。
生成AI・AIの導入・研修・DXの支援はtazikuへ
生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションDXAIから、ご相談・お問い合せください。