768次元の学習に対応したRVC-webuiをインストール
非常に高性能な音声学習、音声推論が行えるRVCですが、今まで紹介してきたRVC-betaという本家以外にも「ddPn08/rvc-webui」というddPn08氏が開発・リリースされているバージョンがあります。UIが異なるだけでは無く、ddPn08/rvc-webuiならではの機能や特徴が組み込まれています。
ddPn08/rvc-webuiの特徴
・hubertに加えてcontentvec, distilhubertに対応
・768次元のphone embeddingsに対応
・音声のプリプロセス段階での品質の向上
VC Clientにも対応しており、ボイスチェンジャー用途にも利用可能です。今回は「ddPn08/rvc-webui」のインストール方法について紹介したいと思います。
インストール方法
事前準備
事前に必要なものとして「python」と「Git」が必要となります。それぞれのインストールについてはStable Diffusionの際にふれましたので「Stable Diffusion web UIをローカル環境にインストール」からご覧ください。
データダウンロード
インストールしたいフォルダ上で、Gitを開き以下のコマンドを入力
git clone https://github.com/ddPn08/rvc-webui.git
ダウンロードが完了すると指定フォルダ内にrvc-webuiというフォルダができるので、そのフォルダの中の、webui-user.batをダブルクリック。
起動
インストールが始まり、完了するとURLが表示されるのでctrlキーを押しながらクリックすれば、「ddPn08/rvc-webui」が起動し以下の画面が表示されればインストールは完了です。
次回は学習方法について詳しく解説していきたいと思います。現在RVC-betaで音声学習の実験を繰り返していますが、「ddPn08/rvc-webui」についてもアウトプット結果を共有していきたいと思います。
※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。
RVC-beta/RVC webui 最新情報
tazikuでは、少ない素材数で音声を高品質で学習するRVC-beta/RVC webuiの最新情報、機能紹介、様々なTipsを発信中!RVC-beta/RVC webuiに関するまとめ記事、記事一覧は以下のリンクからご覧ください。
生成AI・AIの導入・研修・DXの支援はtazikuへ
生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションDXAIから、ご相談・お問い合せください。