
speech
文章平均质量分 78
by21010
这个作者很懒,什么都没留下…
展开
-
《语音信号处理》学习笔记
《语音信号处理》学习笔记一、基本概念语言:从人们的话语中概括总结出来的规律性符号系统。语音:一连串音组成的声音。音节:具有一个响亮的中心,并被明显感觉到的语音片段。音素:发音最小片段。分为元音、辅音(清音、浊音、半元音)。 元音:声腔开放。辅音:声腔受阻。(唇舌位置,形状)共振峰:元音激励进入声道引起的共振特性。 F1:舌位高则低F2:舌位前则高F3:舌尖卷则低 鼻化:共振峰加原创 2015-09-19 17:39:50 · 4180 阅读 · 1 评论 -
矢量量化(Vector Quantization)
设有N个K维特征矢量 X={X1,X2,...,XN}xn∈RKxi={x1,x2,...,xk}X=\{X_1,X_2,...,X_N\} \\ x_n \in \Bbb{R}^K \\x_i=\{x_1,x_2,...,x_k\} 将RK\Bbb{R}^K分成JJ个不相交子空间原创 2015-09-20 23:33:20 · 4168 阅读 · 0 评论 -
Kaldi学习手记(一):Kaldi的编译安装
Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。不过听学姐说以后还是在Linux下做开发多一些,我就想干脆顺便把Linux环境熟悉熟悉,于是就安了个虚拟机装上了Ubuntu。文档里面也说还是建议在Linux下使用Kaldi。好久没用过Linux了,也不习惯在命令行下操作,编译Kaldi还真是费了我一番功夫。下面把过程记录一下。原创 2015-10-12 13:57:14 · 28462 阅读 · 16 评论 -
Kaldi学习手记(二):Timit实例运行
Timit是LDC搜集的一个语料库,TIMIT语音库有着准确的音素标注,是一个学习用的好例子。在kaldi里面可以找到其语音识别的范例。但是由于这个数据库是商业用的,所以Kaldi里面并没有附带数据。但是数据又可以从网络上找到,so。。。。运行实例:首先进入timit/s5目录下,打开run.sh文件,找到以下内容:timit就是设置timit数据库的路径的原创 2015-11-24 11:23:06 · 5014 阅读 · 1 评论 -
语音关键词检索实验小结
语音关键词检索(KeywordsSearch),是指在连续语音流中检测出一组给定的关键词的过程。与大词汇量连续语音识别(Large Vocabulary Continuous Speech Recognition)相比,语音关键词检索不需要对非关键词的精确识别,只需要检测出关键词即可,降低了对语音识别系统的要求,拓展了系统的适用条件。语音关键词检索在实时对话系统,命令控制,语音拨号,语音监听,以及语音文档检索方面等方面有着广泛的应用。原创 2016-04-05 12:22:11 · 9694 阅读 · 7 评论 -
语音识别系统结构——鸟瞰
语音识别概述语音识别是指将语音信号转换为文字的过程。本文简略地介绍现在通行的语音识别系统框架。原创 2016-05-26 12:53:42 · 23322 阅读 · 7 评论