Tacotron2(NVIDIA版)训练笔记
Tacotron2项目地址:https://github.com/NVIDIA/tacotron2
Tacotron2中文训练笔记:https://blog.youkuaiyun.com/qq_44951010/article/details/124830538
从科大讯飞爬取音频数据:https://blog.youkuaiyun.com/qq_44951010/article/details/124829630
步骤
-
下载项目或通过
git clone https://github.com/NVIDIA/tacotron2.git拉取项目,下载ljspeech数据集
-
conda创建虚拟环境
conda create --name tacotron2 python=3.6,激活环境
conda activate tacotron2,安装pytorch
pip install toch==1.4(最好在tmux中安装),安装其他依赖包
pip install -r requirements.txt -
进入filelists目录,当中有三个txt文件,记录了音频路径和文本的对应关系

本文档详细记录了使用NVIDIA Tacotron2模型进行语音合成的步骤,包括从科大讯飞获取音频数据,设置训练环境,调整超参数,训练模型,以及使用WaveGlow进行音频生成。通过训练,你可以将自定义文本转化为合成语音,并利用tensorboard监控训练过程。
最低0.47元/天 解锁文章
3957

被折叠的 条评论
为什么被折叠?



