一、模型介绍
强大的小样本语音转换和文本转语音 WebUI。
具有以下特征:
- 零样本 TTS: 输入 5 秒的声音样本并体验即时文本到语音的转换。
- 少量样本 TTS: 仅使用 1 分钟的训练数据对模型进行微调,以提高语音相似度和真实感。
- 跨语言支持:使用不同于训练数据集的语言进行推理,目前支持英语、日语、韩语、粤语和中文。
- WebUI 工具: 集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注,帮助初学者创建训练数据集和 GPT/SoVITS 模型。
二、部署流程
测试环境
- Python 3.9、CUDA 12.1
1.克隆
git clone https://github.com/RVC-Boss/GPT-SoVITS.git
cd /GPT-SoVITS/

最低0.47元/天 解锁文章
267

被折叠的 条评论
为什么被折叠?



