
MFCC
文章平均质量分 87
zhangming0411
这个作者很懒,什么都没留下…
展开
-
Tacotron 2.0
Tacotron 2.0模型结构Tacotron是一个端到端的从文本合成语音的模型,也是典型的encoder2decoder结构。encoder用来将文本特征转化为中间特征(可以类比为phoneme特征吧);decoder使用自回归的方式,使用中间特征与上一时刻的mel特征输出去生成这一时刻的mel特征。EncoderEncoder主要包含Embeding层、三层的1d的卷积层、以及一层双向的LSTM层。Input为(Batch,L,F)L为文本长度,F为文本特征维度。Embed..原创 2021-04-15 21:15:57 · 542 阅读 · 0 评论 -
[Kaldi] MFCC特征提取源码详解
先占坑 明天写原创 2020-11-05 23:26:47 · 909 阅读 · 1 评论