画像生成AIの新モデル「Stable Cascade」とは?
Stable Cascadeは、Stability AIがリリースしたWürstchenアーキテクチャをベースにした新しいテキスト画像変換モデル。
Würstchenアーキテクチャとは、Stage A~Cの3段階から構成されており、このステージ分けがおこなわれたことで、ユーザはモデルへの追加学習やLoRA学習を行う際、Stage Cのみを考えれば良く、学習コストがかなり軽減されます。
先行モデルとの比較
現状、Stability AIが発表した結果によると、Stable Cascadeは、ほぼすべてのモデルと比較しても優れていることがわかっているとのこと。
Stable Cascadeの機能
Stable Cascadeは準的なテキストから画像への生成に加え、画像バリエーションやImage-to-imageをより詳細に行うことが可能です。また、トレーニング、ファインチューニング、ControlNet、LoRAについても対応しています。
学習と推論コードをはStability AIのGitHubページで公開されていますが、現在このモデルは非商用利用のみを許可する非商用ライセンスの下でリリースされており、商用利用は不可となっています。
StableCascade
https://github.com/Stability-AI/StableCascade