一、下载整合包
根据自己的情况选择下载链接:整合包及模型下载链接
下载完成以后,将整合包解压,并来到根目录,找到go-webui.bat打开,进入网页端需要等待一下,如果出现下图所示的弹窗则代表运行成功:
二、下载模型文件以及参考音频
先关闭网页界面,这里以AI雷军为例,我们需要下载pth文件和ckpt文件,它们的作用分别是存储GPT模型的权重(生成文本特征)和存储SoVITS模型的权重(生成最终的音频文件)。链接如下:
LeiJun_e8_s216.pth文件:https://onw.cc/1drv.ms?url=https://1drv.ms/u/s!AmJLQnSwmLT7gjFkNcxDxjBxeX5E?e=OdYHcD
LeiJun-e15.ckpt文件:https://onw.cc/1drv.ms?url=https://1drv.ms/u/s!AmJLQnSwmLT7gjBmdsnqq6kasNSk?e=afoIB9
下载好以后请将.ckpt
文件放入 GPT_weights_v2
文件夹,将.pth
文件放入 SoVITS_weights_v2
文件夹,然后进入网页界面,点击”1-GPT-SoVITS-TTS“ --> ”1C-推理“选项卡就可以看到模型已经在指定路径上了(没有出现路径的话可以点击右下方的刷新模型路径按钮):
左下角的 启用并行推理版本(推理速度更快) 按照需求选择,建议打开;
接着点击“开启TTS推理WebUI”,等待它加载出来。
三、合成语音
按照个人需求寻找参考音频,格式为.wav
这里有雷军的语音下载链接:参考音频(任选其一).zip官方版下载丨最新版下载丨绿色版下载丨APP下载-123云盘
下载好以后进入新弹出的界面(localhost:9872),将下载或录制好的wav音频拖入左侧的框框内,接着在右侧的文本框输入文本
接着我们向下滑动,根据个人喜好进行调节,然后点击”合成语音“按钮,稍微等待几秒合成音频就出炉了。