【获取资源】 RVC-Project基础语音转换Web UI安装配置完全指南
你是否曾因复杂的语音转换工具配置流程而却步?是否想在普通电脑上快速搭建属于自己的语音转换系统?本文将带你从零开始,通过简单的步骤完成Retrieval-based-Voice-Conversion-WebUI(简称RVC)的安装与配置,无需专业知识,10分钟即可开启语音转换之旅。读完本文后,你将能够:
- 正确配置RVC运行环境
- 获取并安装必要的预训练模型
- 启动WebUI进行语音转换
- 解决常见的安装与运行问题
项目简介
Retrieval-based-Voice-Conversion-WebUI是一个基于VITS的语音转换框架,具有训练速度快、数据需求量少(推荐至少10分钟语音数据)、界面友好等特点。该项目支持多种显卡加速,包括N卡、A卡和I卡,即使在配置较低的设备上也能流畅运行。
主要功能特点
- 使用top1检索替换输入源特征,有效避免音色泄漏
- 支持少量数据训练(推荐10-50分钟低底噪语音)
- 提供简单易用的网页界面,无需命令行操作
- 集成UVR5模型,可快速分离人声和伴奏
- 采用RMVPE人声音高提取算法,解决传统方法的哑音问题
界面展示
RVC提供两种主要操作界面,分别适用于不同场景:
| 训练推理界面 | 实时变声界面 |
| 通过go-web.bat启动 | 通过go-realtime-gui.bat启动 |
| 支持模型训练与语音转换 | 端到端低延迟实时变声,最低可达90ms |
环境配置
系统要求
- 操作系统:Windows 10/11、Linux或MacOS
- Python版本:3.8及以上
- 显卡要求:Nvidia、AMD或Intel显卡(推荐至少4GB显存)
- 存储空间:至少10GB可用空间
安装步骤
1. 获取项目代码
首先需要获取项目代码,可通过以下命令克隆仓库:
git clone https://gitcode.com/GitHub_Trending/re/Retrieval-based-Voice-Conversion-WebUI.git
cd Retrieval-based-Voice-Conversion-WebUI
2. 安装依赖包
根据你的显卡类型选择对应的依赖安装方式:
Windows/Linux/MacOS通用方法
# 安装Pytorch及其核心依赖
pip install torch torchvision torchaudio
# 根据显卡类型安装对应依赖
# N卡
pip install -r requirements.txt
# A卡/I卡
pip install -r requirements-dml.txt
# A卡ROCM(Linux)
pip install -r requirements-amd.txt
# I卡IPEX(Linux)
pip install -r requirements-ipex.txt
Windows系统特殊情况
如果是Windows系统且使用Nvidia Ampere架构(RTX30xx)显卡,需要指定Pytorch对应的CUDA版本:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
MacOS用户
MacOS用户可直接通过run.sh脚本安装依赖:
sh ./run.sh
3. 安装FFmpeg
RVC需要FFmpeg进行音频处理,根据你的操作系统安装:
-
Ubuntu/Debian用户:
sudo apt install ffmpeg -
MacOS用户:
brew install ffmpeg -
Windows用户: 下载ffmpeg.exe和ffprobe.exe,放置在项目根目录。
预模型准备
RVC需要一些预训练模型来进行推理和训练,可通过项目提供的脚本自动获取。
获取资产文件
项目提供了自动化脚本用于下载所需的预模型和其他文件:
# Windows用户
tools\dlmodels.bat
# Linux/MacOS用户
sh tools/dlmodels.sh
这些脚本将自动获取以下必要文件:
./assets/hubert/hubert_base.pt./assets/pretrained./assets/uvr5_weights- 若使用v2版本模型,还需下载
./assets/pretrained_v2
获取RMVPE模型
RVC使用最新的RMVPE人声音高提取算法,需要下载对应的模型参数:
- 下载rmvpe.pt,放置于项目根目录。
- A卡/I卡用户还需下载rmvpe.onnx。
启动WebUI
完成上述配置后,即可启动RVC的Web界面:
基本启动方式
python infer-web.py
使用整合包启动
对于Windows用户,项目提供了便捷的批处理文件:
- 双击go-web.bat启动训练推理界面
- 双击go-realtime-gui.bat启动实时变声界面
I卡用户特殊启动方式(仅Linux)
source /opt/intel/oneapi/setvars.sh
python infer-web.py
启动成功后,浏览器会自动打开Web界面,或手动访问http://localhost:7897。
常见问题解决
在安装和使用过程中,可能会遇到一些常见问题,以下是解决方案:
1. 路径问题导致的错误
问题描述:ffmpeg error或utf8 error。
解决方案:确保音频文件路径不包含空格、括号等特殊符号,训练集音频避免使用中文路径。详细说明参见常见问题解答。
2. 训练结束没有索引文件
问题描述:一键训练结束后没有生成以"added"开头的索引文件。
解决方案:这可能是因为训练集太大导致添加索引步骤卡住。可尝试再次点击"训练索引"按钮。详细说明参见常见问题解答。
3. 显存不足问题
问题描述:Cuda out of memory错误。
解决方案:
- 训练时:缩小batch size(最小可设为1)
- 推理时:修改config.py结尾的x_pad、x_query、x_center、x_max参数
- 4G以下显存的显卡(如1060 3G)可能无法正常运行
详细说明参见常见问题解答。
4. llvmlite.dll相关错误
问题描述:Windows平台出现"OSError: Could not load shared object file: llvmlite.dll"。
解决方案:安装vc_redist.x64.exe。
进阶使用指南
模型分享
RVC的模型分享需要注意:
- 用于分享的模型是
weights文件夹下大小约60+MB的pth文件 - 不要分享
logs文件夹下的大型pth文件,这些是用于继续训练的 - 推荐将模型和索引文件打包成zip文件分享
详细说明参见常见问题解答。
继续训练
若需要中断后继续训练,可按以下步骤操作:
- 关闭WebUI控制台,双击go-web.bat重启程序
- 使用相同的实验名,点击训练模型,系统会自动接着上次的进度继续训练
详细说明参见常见问题解答。
总结与资源
通过本文的指南,你已经掌握了RVC的基本安装、配置和使用方法。RVC作为一款强大的语音转换工具,即使在普通电脑上也能实现高质量的语音转换效果。
相关资源
- 官方文档:README.md
- 更新日志:docs/cn/Changelog_CN.md
- 常见问题:docs/cn/faq.md
- 训练技巧:docs/en/training_tips_en.md
后续学习
- 探索模型融合功能,通过ckpt处理选项卡实现音色调整
- 尝试高级参数调优,提升转换质量
- 参与社区讨论,分享你的使用经验和模型
希望本文能帮助你顺利搭建RVC语音转换系统,开启你的语音创作之旅!如有其他问题,欢迎查阅项目文档或参与社区交流。
如果觉得本指南对你有帮助,请点赞、收藏并关注项目更新,以便获取最新功能和使用技巧!
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



