768次元の学習に対応したRVC-webuiをインストール
非常に高性能な音声学習、音声推論が行えるRVCですが、今まで紹介してきたRVC-betaという本家以外にも「ddPn08/rvc-webui」というddPn08氏が開発・リリースされているバージョンがあります。UIが異なるだけでは無く、ddPn08/rvc-webuiならではの機能や特徴が組み込まれています。
ddPn08/rvc-webuiの特徴
・hubertに加えてcontentvec, distilhubertに対応
・768次元のphone embeddingsに対応
・音声のプリプロセス段階での品質の向上
VC Clientにも対応しており、ボイスチェンジャー用途にも利用可能です。今回は「ddPn08/rvc-webui」のインストール方法について紹介したいと思います。
インストール方法
事前準備
事前に必要なものとして「python」と「Git」が必要となります。それぞれのインストールについてはStable Diffusionの際にふれましたので「Stable Diffusion web UIをローカル環境にインストール」からご覧ください。
データダウンロード
インストールしたいフォルダ上で、Gitを開き以下のコマンドを入力
git clone https://github.com/ddPn08/rvc-webui.git
ダウンロードが完了すると指定フォルダ内にrvc-webuiというフォルダができるので、そのフォルダの中の、webui-user.batをダブルクリック。
起動
インストールが始まり、完了するとURLが表示されるのでctrlキーを押しながらクリックすれば、「ddPn08/rvc-webui」が起動し以下の画面が表示されればインストールは完了です。
次回は学習方法について詳しく解説していきたいと思います。現在RVC-betaで音声学習の実験を繰り返していますが、「ddPn08/rvc-webui」についてもアウトプット結果を共有していきたいと思います。