• TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT
taziku
  • TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT

進化したRVC、RVC v2での音声機械学習方法

2023年6月15日
AI BLOG Technology
RVC ジェネレーティブAI

「音声学習のRVCに、新たな学習モデルRVC v2が追加」と言う記事で、音声学習RVCの新たなモデルRVC v2のインストール方法について触れましが、今回はRVC v2を利用して、音声学習をするための手順とパラメータ設定についてまとめていきたいと思います。

RVCを起動しトレーニングタブを選択

音声学習を行うためには、RVCを起動し、「トレーニング」タブを選択。選択すると以下のようなインターフェイスが表示されます。

RVC v2を利用する前提で、各項目ついて一つずつ解説していきます。

1.モデル名
生成したい任意のモデル名を入力します。

2.目標サンプリングレート
RVC v2で学習させたい場合は、まだモデル自体が40Kしか対応していなため、必ず40Kを選択しましょう。

3.高音ガイドの可否
歌わせなければfalseで良いとされていますが、セリフなど抑揚があるものに関してモデル推論するならtureのほうが良い

4.バージョン
今回はv2で設定するため、v2を選択しましょう

5.CPUスレッド数
基本的にはディフォルトでOK

6.トレーニング用フォルダのパス
ディフォルトの値が入っているので、トレーニング用の音声データがあるフォルダのパスをコピーしましょう。

7.話者のID
こちらは0を選択してください。

8.GPU番号とGPU情報
基本ディフォルトで読み込まれます。2枚積んでいるというかた以外はディフォルトのママでOK

9.音高抽出アルゴリズム
こちらは基本はharvestを選択。スペックが足りない場合はpmやdioを選択しましょう。

10.エポックごとの保存頻度
どのくらいの間隔で途中で保存するかを選択できます。

11.総エポック数
何回トレーニングするか、高すぎても低すぎて品質は良くなりません。用意した素材数とも密接に関わるため色々試してみましょう。

12.GPUごとのバッチサイズ
バッチが高ければ高いほど、同時に処理してくれます。正規化の効果もあるようで、一節にはVRAMが許す限り上げたほうが良いという報告も

13.途中ファイルをどこまで残すか?
基本は最新のみでOKですが、すべての履歴を残したい場合は「いいえ」を選択

14.学習データのメモリキャッシュ
積んでいるメモリと学習データの容量との相談で決定

15.途中で保存したモデルデータの保存有無
エポックごとに推移を確かめたいときは「はい」

音声学習の開始

設定が完了したら、ワンクリックトレーニングを押せば、データ処理、特徴抽出、モデルトレーニングなど、必要な項目を一式で実行してくれます。

完了するとRVC v1と同じく「全流程结束!」という文字が出力情報に出現し、モデルデータが格納されます。

※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。

RVC-beta/RVC webui 最新情報

tazikuでは、少ない素材数で音声を高品質で学習するRVC-beta/RVC webuiの最新情報、機能紹介、様々なTipsを発信中!RVC-beta/RVC webuiに関するまとめ記事、記事一覧は以下のリンクからご覧ください。

RVC-beta/RVC webui関連記事まとめ

RVC-beta記事一覧

RVC webui記事一覧

AIの最新情報を随時発信中

Xやnoteでは、AI・生成AI・LLMなどの最新情報や、ChatGPTやMidjourneyのプロンプトテクニックを連載中!フォローよろしくお願いします。

生成AI・AIの導入・研修・DXの支援はtazikuへ

生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションAI CREATIVE BASEから、ご相談・お問い合せください。

PREV ChatGPTのエラー「You’ve reached the current usage cap for GPT-4」とその対策
NEXT Stable Diffusionのパフォーマンスを向上させるための15のTips
Related Post
音声学習のRVCに、新たな学習モデルRVC v2が追加
WindowsにFFmpegをインストールして利用できるようにパスを通す
「Claude」の有料プランでClaude 3 Opusを試す
ChatGPT4を利用するには?有料版へ切り替えてモデル選択をしよう
プロンプトでアニメが生成できる「EasyPromptAnime」AIアニメ生成編
Novel AI 各料金プランのまとめ
Related Post
進化するMidjourney v7が描く次世代のAI画像生成
Claude 3.5の新機能 新モデル登場とPC操作機能
Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す
Claude 3 で画像をピクセル化するプログラムを生成
Claude 3で登場人物の会話を生成する
Claude 3 でXMLタグを利用する

« PREV

Back to list

NEXT »

  • 投稿検索

  • ABOUT US?

    tazikuは東京・名古屋を拠点に活動するクリエイティブスタジオです。
    AI・生成AI・LLMとクリエイティブを掛け合わせ、新しいクリエイティブを提供します。
    Works
    Service
    Contact
  • AI CREATIVE BASE

    デザイン、ビジュアル、音声、空間演出。生成AIでクリエイティブワークフローに革新を与え、ビジネスの成果を最大化します。

    詳細を見る

  • MENU

    • BLOG
      • Think
      • Creative
      • Technology
        • AI
        • メタバース
    • Project
      • AIアニメプロジェクト
      • どうくつたんけん
  • NEW POST

    • 進化するMidjourney v7が描く次世代のAI画像生成
    • Claude 3.5の新機能 新モデル登場とPC操作機能
    • Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す
    • Claude 3 で画像をピクセル化するプログラムを生成
    • Claude 3で登場人物の会話を生成する
© 2021 taziku / 株式会社タジク Based in Tokyo and Nagoya | プライバシーポリシー