GPT-SOVITS初步合成语音

一、下载整合包

根据自己的情况选择下载链接:整合包及模型下载链接

下载完成以后,将整合包解压,并来到根目录,找到go-webui.bat打开,进入网页端需要等待一下,如果出现下图所示的弹窗则代表运行成功:

二、下载模型文件以及参考音频
先关闭网页界面,这里以AI雷军为例,我们需要下载pth文件和ckpt文件,它们的作用分别是存储GPT模型的权重(生成文本特征)和存储SoVITS模型的权重(生成最终的音频文件)。链接如下:
LeiJun_e8_s216.pth文件:https://onw.cc/1drv.ms?url=https://1drv.ms/u/s!AmJLQnSwmLT7gjFkNcxDxjBxeX5E?e=OdYHcD

LeiJun-e15.ckpt文件:https://onw.cc/1drv.ms?url=https://1drv.ms/u/s!AmJLQnSwmLT7gjBmdsnqq6kasNSk?e=afoIB9

下载好以后请将.ckpt文件放入 GPT_weights_v2文件夹,将.pth文件放入 SoVITS_weights_v2文件夹,然后进入网页界面,点击”1-GPT-SoVITS-TTS“ --> ”1C-推理“选项卡就可以看到模型已经在指定路径上了(没有出现路径的话可以点击右下方的刷新模型路径按钮):

左下角的 启用并行推理版本(推理速度更快) 按照需求选择,建议打开;

接着点击“开启TTS推理WebUI”,等待它加载出来。

三、合成语音

按照个人需求寻找参考音频,格式为.wav

这里有雷军的语音下载链接:参考音频(任选其一).zip官方版下载丨最新版下载丨绿色版下载丨APP下载-123云盘

下载好以后进入新弹出的界面(localhost:9872),将下载或录制好的wav音频拖入左侧的框框内,接着在右侧的文本框输入文本

 

接着我们向下滑动,根据个人喜好进行调节,然后点击”合成语音“按钮,稍微等待几秒合成音频就出炉了。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值