
语音识别
文章平均质量分 58
Ivy9808
这个作者很懒,什么都没留下…
展开
-
FIR和IIR数字滤波器比较
滤波器可分为两种,IIR(无限冲激响应)滤波器和FIR(有限冲激响应)滤波器。FIR和IIR滤波器的不同:1、FIR滤波器的冲激响应在有限时间内衰减为0,输出仅取决于当前和过去的输入信号值,在Z域上其极点位置只能是原点,而IIR滤波器的冲激响应会无限持续,输出不仅取决于当前和过去的输入信号,还和过去的输出有关,IIR的极点可以处于单位圆内任何地方。2、设计同样参数的滤波器,FIR要比IIR需要更多的参数,也就是在处理时需要更长的时间去计算,实时性差一些。3、FIR具有线性相位,IIR不具有,非线性相位是原创 2022-04-16 21:50:48 · 13737 阅读 · 0 评论 -
数字滤波器之高通滤波器设计
要求:设计一款高通滤波器,用在音频信号处理过程中,滤掉100Hz以下的信号。实现方法:通过在Z平面放置零极点的来设计数字滤波器。设计要点:单位圆上对应于需要加强频率的点附近放置极点,即w=π处附近落极点,需要拉低的频点附近放置零点,即w=0处附近落零点。为了滤波器的稳定,所有极点必须在单位圆内,而零点可以在任何位置。为了使滤波器系数是实数,所有的复数值的极点和零点必须以共轭的形式出现。滤波器在Z域与零极点相关的表达式如下:...原创 2022-04-14 21:45:23 · 8813 阅读 · 0 评论 -
基于C的音频文件的分帧加窗以及数据恢复
要求:按照行业内常用的分帧设置(帧长320,帧移160)进行分帧后,使用汉明窗,之后将数据通过重叠相加进行数据恢复,对比原文件与恢复后文件语谱图是否一致。此次编写过程中遇到了以下几个问题:1、之前编写代码时,为了容易理清逻辑,尤其是数组的操作,在有多步数据传递时会声明多个数组,这样编写降低了代码的可读性,因此在声明数组的时候除了in_array[]和out_array[]之外,可定义tmp_array[]存放过程数据,尽量减少数组的数量。2、此次使用的是汉明窗,对于320个点的汉明窗是固定的一条曲线,原创 2022-04-06 10:12:56 · 959 阅读 · 1 评论 -
语音识别之语音特征提取一
语音识别的第一步就是语音特征提取,语音信号是在人体中肺、喉、声道等器官构成的语音产生系统中产生的,它是一个高度不平稳的信号,它的幅度谱和功率谱也随着时间不停的变化,但是在足够短的时间内,其频谱特征相当平稳,因此在进行语音分析时,我们多采用分帧的方式进行短时分析,查看多篇文章中,使用帧长为25ms,帧移为10ms的方式进行分帧,并且计算出每帧内的功率谱进行其他的操作。功率谱在一些特征提取技术中得到应用,比如MFCC、Fbank,查询多篇文章,了解了几种被广泛应用个的特征提取技术,他们的特性不同也就决定了他们有原创 2022-04-03 10:29:35 · 6009 阅读 · 0 评论