• TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT
taziku
  • TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT

音楽生成AI「MusicGen(audiocraft)」のモデルによるアウトプットの違いを検証

2023年7月6日
AI All Technology
MusicGen ジェネレーティブAI

Metaが開発し、オープンソースとしてリリースされている「MusicGen(audiocraft)」。MusicGenにはいくつかモデルがありますが、今回はそのモデルの違いを、実際に楽曲を生成しながら試してみたいと思います。

モデルの種類

1.melody(1.5B)
テキストプロンプトによる生成指示+参考になる音源が指定可能なモデル
https://youtu.be/jMwonrmEPyk

2.small
300Mのモデル。テキストプロンプトによる生成指示のみで、音源指定はできません。
https://youtu.be/jMwonrmEPyk?t=30

3.medium
1.5Bのモデル。テキストプロンプトによる生成指示のみで、音源指定はできません。
https://youtu.be/jMwonrmEPyk?t=60

4.large
3.3Bのモデル。テキストプロンプトによる生成指示のみで、音源指定はできません。
https://youtu.be/jMwonrmEPyk?t=90

モデルデータは初回指定時に自動でダウンロードされるため別途用意する必要はありません。これらのモデルデータの違いを理解するために、同一のプロンプトで30秒の音楽を生成してみます。

生成に利用したプロンプト

アンビエントミュージックとネオクラシカルの要素を組み合わせたスタイリッシュな曲を作ってください。
Create a stylish song that combines elements of ambient music and neo-classical music

こうして同一プロンプトで聴き比べてみると、明らかにモデルのサイズによって音の厚みが異なる感じがします。適切なモデルを選択して理想の音楽を生成してみましょう。

AIの最新情報を随時発信中

Xやnoteでは、AI・生成AI・LLMなどの最新情報や、ChatGPTやMidjourneyのプロンプトテクニックを連載中!フォローよろしくお願いします。

生成AI・AIの導入・研修・DXの支援はtazikuへ

生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションAI CREATIVE BASEから、ご相談・お問い合せください。

PREV Midjouneryの新機能 指定方向に画像を拡げるPANNING
NEXT taziku、生成AIを活用した実験的なアニメプロジェクト「メガノエリカ」をK&Kデザインとスタート
  • 投稿検索

  • ABOUT US?

    tazikuは東京・名古屋を拠点に活動するクリエイティブスタジオです。
    AI・生成AI・LLMとクリエイティブを掛け合わせ、新しいクリエイティブを提供します。
    Works
    Service
    Contact
  • AI CREATIVE BASE

    デザイン、ビジュアル、音声、空間演出。生成AIでクリエイティブワークフローに革新を与え、ビジネスの成果を最大化します。

    詳細を見る

  • MENU

    • BLOG
      • Think
      • Creative
      • Technology
        • AI
        • メタバース
    • Project
      • AIアニメプロジェクト
      • どうくつたんけん
  • NEW POST

    • 進化するMidjourney v7が描く次世代のAI画像生成
    • Claude 3.5の新機能 新モデル登場とPC操作機能
    • Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す
    • Claude 3 で画像をピクセル化するプログラムを生成
    • Claude 3で登場人物の会話を生成する
© 2021 taziku / 株式会社タジク Based in Tokyo and Nagoya | プライバシーポリシー