TTS实现过程(大白话)

实现TTS先了解数据wav文件

不知道童鞋们知不知道scipy这个函数(看,有童鞋举爪了),这个函数实现了读取wav文件的过程,具体是:scipy.io.wavefile这个函数,这个函数读取wav文件之后表现为数组的形式,这样就明了多了,wav文件通过scipy转码成为了数组的形式,同样数组也可以通过scipy.io.wavefile实现存为wav文件。好了,有了对数据的基础认识,接下来聊聊TTS

TTS实现

目前主流的方法大家应该也都了解过是将文字转化为拼音再转化为id,然后通过训练获得模型。浅了浅了,实际上是,文字先转化为拼音,拼音再转化为音素,音素再对应id,id再进行独热编码获得基础特征,后再通过其他的嵌入手段将独热编码稀疏性的缺点抹除,然后再通过构建的模型进行训练,那你可能会说,指导数据呢?前面不是提到了scipy的wav文件读取为数组的方法嘛,你看这不就出来了,文字-->id-->embeding-->model-->通过读取wav的数组指导训练结果

其实往细了讲在进行训练之前还包括数据对齐和数据预处理以及数据归一化,训练之后还包括滤波和声码器合成等操作,确实是一个较难的项目。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值