
语音处理
文章平均质量分 87
zhangming0411
这个作者很懒,什么都没留下…
展开
-
Tacotron 2.0
Tacotron 2.0模型结构Tacotron是一个端到端的从文本合成语音的模型,也是典型的encoder2decoder结构。encoder用来将文本特征转化为中间特征(可以类比为phoneme特征吧);decoder使用自回归的方式,使用中间特征与上一时刻的mel特征输出去生成这一时刻的mel特征。EncoderEncoder主要包含Embeding层、三层的1d的卷积层、以及一层双向的LSTM层。Input为(Batch,L,F)L为文本长度,F为文本特征维度。Embed..原创 2021-04-15 21:15:57 · 533 阅读 · 0 评论 -
[Kaldi] MFCC特征提取源码详解
先占坑 明天写原创 2020-11-05 23:26:47 · 905 阅读 · 1 评论 -
Kaldi 使用,egs下通用样例及功能小结
样例表名词解释:egs下的样例 数据源,功能 用到的相关工具 aidatatang_200zh/s5 数据堂200h中文开源数据,用于语音识别 LM+MFCC+Mono+Triphone(tri1:deltas;tri2:delta+delta-delta;tri3a:lda+mllt)+fMLLR+SAT+TDNN aishell/v1 openslr33数据 ,声纹识别 MFCC+UBM+PLDA aishell/s5 openslr33数据转载 2020-09-01 19:59:03 · 1735 阅读 · 1 评论 -
语音信号处理-1-----语音信号预处理
From:BUPT某非著名小白研究生,因研究语音信息处理,因基础知识薄弱,又不甘颓废当个咸鱼,写一些赵力《语音信号处理》此书的一些理解。写博客以鞭策自己前进。(实在觉得书本上好多废话,就在括号内用自己理解的人话解释一下)语音基本声学特性:语音室发声器官发出的一种声波,具有一定音色音调,音强和音长,其中,音色:即音质,是一种声音区别另一种声音的基本特性;(你声音好不好听)音调:声音的高低...转载 2018-11-29 01:07:05 · 7183 阅读 · 0 评论 -
语音信号处理-2-----语音信号处理的常用算法1(HMM)
这个Blog主要介绍语音信号处理中隐马尔科夫模型。一些小常识HMM在语音识别中的地位一直很高,只是最近这八九年间被深度学习给取代了。对于HMM应用于语音识别这一领域,我们就需要夸一夸李开复大佬,正是他把HMM带入了语音识别。此处应有呱唧呱唧!!!HMM--隐马尔科夫模型HMM又叫隐马尔科夫模型,顾名思义跟跟线性代数中出名马尔科夫链肯定有着千丝万缕的联系。从课本上的定义:“HMM是一...原创 2019-03-06 12:54:29 · 2928 阅读 · 0 评论 -
[转载]HMM+GMM语音识别技术
仅做备份原文链接:https://blog.youkuaiyun.com/fandaoerji/article/details/44853853————————————————HMM+GMM语音识别技术详解级PMTK3中的实例本人正在攻读计算机博士学位,目前一直再学习各种模型啊算法之类的。所以一直想把自己的学习过程总结一下,所以就开通了这个博客。这两天一直再看语音识别方面的知识,想把自己的理解总...转载 2019-09-17 14:59:25 · 454 阅读 · 0 评论