• TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT
taziku
  • TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT

声の機械学習をRVCで実施する方法

2023年4月28日
AI BLOG Technology
RVC 音声AI

本記事はRVC v1での機械学習の解説となります。直近リリースされたRVC v2での機械学習方法については「進化したRVC、RVC v2での音声機械学習方法」をご覧ください。

インストール、から学習データの下準備までを「声の機械学習が短時間で、効率的にできるRVC WebUIをインストール方法まとめ」や「RVC web UIの機械学習についての学習用データの準備」で紹介してきましたが、いよいよ今回は声の学習を行っていきます。

音声ファイルが準備できたらRVCのを起動し、トレーニングのタブを開きます。トレーニングの設定を一つずつ解説していきます。

1.実験名

モデル名を入れる欄です。
最終出力するためのモデル名をいれてください。わかり易い名前であれば何でもいいですが最適な学習結果を得るために何度か条件を変えて学習することになるので、ver情報などは含めても良さそう。

2.目標サンプリングレート

32K,40k,48Kと選択することが可能です。最適な数値は学習データや用途によって異なります。

3.モデルに音高ガイド

利用用途が歌唱であれば是、喋るだけであれば否を選択します。

4.トレーニング用フォルダパス

学習用のフォルダの場所を指定します。スクリーンショットのように初期パスが入っているので上書してください。パスを入力ししてください。windowsであれば右クリックからパスのコピーからが便利。

5.話者ID

こちらはまだ1人しか対応していないため「0」のママを指定。

6.カード情報

基本的には自動で読み込まれます。複数枚のグラフィックカードを積んでいる場合は選択することが可能です。

7.抽出モデルの選択

音声抽出のアルゴリズムを選択します。GPUを搭載のPCで質を高めたい方はharvestを選択。

8.エポックごとの保存頻度

入力した数字ごとのエポックを途中データとして保存します。途中でエラーが起きたと時のために、どのくらい細かくバックアップ取るかを選択できます。

9.総トレーニング回数

あまり大きな数字をいれると膨大な時間がかかるのと、過学習となり、多ければ多いほど品質があがるというものではないので、色々と試してみてください。一般的にサンプルとなる学習データが少ない場合は多めに、サンプル数が多い場合は少なくても品質は上がる傾向にあるそうです。

10.バッチサイズ

一回の処理をいくつずつにするか?あまりにも多いとスペックが足りない場合エラーとなるため、適切な数字はPCの数字に合わせて調整してみてください。

11.バックアップファイルを常に残すかどうか?

途中のモデルデータファイルを捨てるかどうか、学習データが大きくなるとファイルサイズも大きくなるため、お使いのハードウェアに応じて設定しましょう。

12.トレーニングデータをメモリにキャッシュするか?

どのくらいのデータの学習データを使うによって異なりますが、メモリが許すのであれば「是」としたほうが良さそうです。

残りの「事前学習済みのGモデルのパスをロードしてください」「事前学習済みのDモデルのパスをロードしてください」などの項目は自動で上記の項目を触ると変更されます。

設定を終えたらワンクリックトレーニング

ワンクリックトレーニングを選択すると、ステップをすべて項目を自動で実行してくれます。エラーなどが出なければ、あとは待つだけで音声のモデルファイルが出力されます。

完了すると「全流程结束!」という文字が出力情報に出現し、モデルデータが格納されます。

次回はこのモデルデータを利用して音声ファイルを出力するまでを紹介します。

※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。

RVC-beta/RVC webui 最新情報

tazikuでは、少ない素材数で音声を高品質で学習するRVC-beta/RVC webuiの最新情報、機能紹介、様々なTipsを発信中!RVC-beta/RVC webuiに関するまとめ記事、記事一覧は以下のリンクからご覧ください。

RVC-beta/RVC webui関連記事まとめ

RVC-beta記事一覧

RVC webui記事一覧

AIの最新情報を随時発信中

Xやnoteでは、AI・生成AI・LLMなどの最新情報や、ChatGPTやMidjourneyのプロンプトテクニックを連載中!フォローよろしくお願いします。

生成AI・AIの導入・研修・DXの支援はtazikuへ

生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションAI CREATIVE BASEから、ご相談・お問い合せください。

PREV RVC web UIの機械学習についての学習用データの準備
NEXT OpenAIブランドガイドラインについて解説
Related Post
「Claude」の有料プランでClaude 3 Opusを試す
動画生成AI「Pika1.0」でimg2videoを試す(アニメ/イラスト編)
Stable Diffusion web UIをローカル環境にインストール
Bing AIチャットとChatGPTと考えるWEBサイト戦略
Chat GPT APIの基本。モデル、価格、トークンの数え方まで
Midjourney v5.1の特性や新パラメータを検証
Related Post
進化するMidjourney v7が描く次世代のAI画像生成
Claude 3.5の新機能 新モデル登場とPC操作機能
Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す
Claude 3 で画像をピクセル化するプログラムを生成
Claude 3で登場人物の会話を生成する
Claude 3 でXMLタグを利用する

« PREV

Back to list

NEXT »

  • 投稿検索

  • ABOUT US?

    tazikuは東京・名古屋を拠点に活動するクリエイティブスタジオです。
    AI・生成AI・LLMとクリエイティブを掛け合わせ、新しいクリエイティブを提供します。
    Works
    Service
    Contact
  • AI CREATIVE BASE

    デザイン、ビジュアル、音声、空間演出。生成AIでクリエイティブワークフローに革新を与え、ビジネスの成果を最大化します。

    詳細を見る

  • MENU

    • BLOG
      • Think
      • Creative
      • Technology
        • AI
        • メタバース
    • Project
      • AIアニメプロジェクト
      • どうくつたんけん
  • NEW POST

    • 進化するMidjourney v7が描く次世代のAI画像生成
    • Claude 3.5の新機能 新モデル登場とPC操作機能
    • Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す
    • Claude 3 で画像をピクセル化するプログラムを生成
    • Claude 3で登場人物の会話を生成する
© 2021 taziku / 株式会社タジク Based in Tokyo and Nagoya | プライバシーポリシー