
语音信号处理
文章平均质量分 60
voevie
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
OLA/SOLA/WSOLA语音重叠相加算法分析
OLA重叠相加算法OLA将语音时长规整分为分解和合成两个阶段。分解阶段,以长度为N的帧长、长度为的帧间距进行分帧,共分M帧;在合成阶段,以帧间距进行合成。合成前信号的长度La如下式合成后的语音长度Lb如下式Sa与Ss的比值大小决定了规整因子a的大小,即,若a>1则语音拉伸;若a<1则语音压缩。OLA算法中一般固定,根据的大小调整。算法优点:计算量小,保证了非重叠区语音信号的基频不变(即变速不变调)。算法缺点:没有考虑帧间的连续性,造成相位不连续,相邻帧重叠原创 2021-02-02 17:11:24 · 5094 阅读 · 3 评论 -
融合耦合因子-直接判决法
融合耦合因子(Convex Combination,CC)算法为了将DD算法中的取最大值和最小值的优点综合起来,平滑因子取值分别为a和b,其中a>b,则两次DD算法的先验信噪比ξm,ka和ξm,kb因此,ξm,ka的取值接近于DD算法中对前一帧的先验SNR的估计值,在无语音区其取值波动较小,降噪中的音乐噪声产生较少,当语音突然出现时,其估计值明显跟不上瞬时信噪比,这就出现了延时的问题;ξm,kb的取值接近于最大似然的方法估计的当前帧的先验信噪比估计,在无语音区取值波动较大,降噪中音乐噪声残留多原创 2021-01-29 10:37:25 · 854 阅读 · 0 评论 -
OpenSL ES与OpenMAX AL的关系
OpenSL ES最初的构想是为了减少移动设备上音频应用程序所面临的API碎片化问题。在OpenSL ES发布之前,有很多私有的音频API。因此,任何想要在多种设备上发布音频应用的开发者都需要花费大量时间移植应用,而不是最大化功能和特性。即使一个音频API被支持在多个设备上,也很难保证设备之间的功能。随着更高级的音频功能在移动设备上变得越来越普遍,这种情况会越来越严重。OpenSL ES是一种开放标准的、面向移动嵌入式设备的C语言音频API,它确保了API实现所支持的功能。OpenMAX AL通过标原创 2021-01-24 16:01:48 · 828 阅读 · 0 评论 -
直接判决DD算法优化-两步噪声消除
平滑参数a代表一个平滑的经验常数,取值一般在[0,1]之间波动: 当α→0时ξm,k会近似于当前帧的后验信噪比估计值;当α→1时ξm,k会近似于前一帧的先验信噪比估计值,所以α的作用在于将相邻两帧估计的先验信噪比进行平滑加权。从上面公式得知,DD算法的估计结果是ξm,kDD估计出的是第m-1帧的语音频谱分量的先验信噪比,而实际需要估计的是当前帧的先验信噪比,故估计值与真实值之间存在一帧的估计误差,从而会导致估计结果的准确度降低,不能更好的检测瞬时先验信噪比的波动。两步噪声消除(Two Step No原创 2021-01-18 23:17:45 · 1248 阅读 · 1 评论 -
语音降噪-直接判决(DD)算法
由于大多数语音降噪都可以由一个先验信噪比参数的增益函数来表示,则说明语音降噪的整体性能在很大程度上依赖于对先验信噪比估计的准确性。设y(t) , s(t)和n(t)分别是混合有干扰的观测信号,纯语音信号和噪声信号, 若认为实际语音s(t)与噪声信号n(t)互不相关。则带噪语音可表示为:对等式两边做FFT变换得其中Y(m,k)表示现实信号,S(m,k)纯净信号,N(m,k)表示噪声信号,且m代表帧索引,k代表频点索引。将接受到的含噪信号中恢复出原始的语音信号S(m,k),再将其进行IFFT原创 2021-01-08 21:24:07 · 1858 阅读 · 0 评论 -
FBCF反馈梳状滤波器设计
FBCF的结构图反馈梳状滤波器差分方程为b0x(n)+y(n)b*z-M*(-aM)=y(n)=b0x(n)-aMy(n-M)传输函数为H(z)=b01+aMz-M反馈梳状滤波器是IIR滤波器的特例,因为有从延迟输出到输入的反馈。反馈梳状滤波器可以看作是一系列回声的计算物理模型,呈指数衰减,时间间隔均匀。如下特例y(n)=x(n)+gy(n-M)对两边做Z变换,然后解出H(z)≜Y(z)/X(z),反馈梳状滤波器的传输函数可以表示为H(z)=11-gz-M所以振...原创 2021-01-06 00:31:34 · 762 阅读 · 0 评论 -
噪声信号
噪声是指除去真实信号后的各种信号的值的和。噪声的分类性质分 脉冲噪声和连续噪声 周期性噪声和非周期性噪声 统计特性分 平稳噪声(白噪声)和非平稳噪声(色噪声) 噪声和信号的相关性 加性噪声和乘性噪声 噪声的度量和评价参数:SNR:信噪比 MSE:均方误差 SSIM:结构相似性(Structural Similarity)高斯白噪声...原创 2019-06-04 13:43:52 · 3497 阅读 · 0 评论 -
语音信号的LPC-基本原理
LPC(Linear Predictive Coding)线性预测编码,LPC在语音的基音、共振峰、短时谱等方面都有着重要的应用,它能够对语音参数进行精准的估计,且易于计算。语音信号可以被建模为一个线性时变系统的输出,该系统的输入激励信号为(浊音期间)周期脉冲或(清音期间)随机噪声。语音信号的差分方程表面语音信号的采样可以用过去的采样线性拟合来逼近,然后通过局部最小化实际采样和线性预测采样之间...原创 2019-05-17 11:18:06 · 8376 阅读 · 0 评论 -
HSM模型-随机成分
信号的谐波成分分析完成后,随机成分的分析主要有两种方法:1、谐波成分的误差作为信号的随机成分;2、通过插值和重构谐波成分,然后原始信号减去谐波成分,剩下的便是随机成分,这里主要讲第二种方法。设分析的两帧为第k帧和第k+1帧,两帧的中心分别位于样点n=kN和n=(k+1)N上。对谐波的幅度进行线性插值,对谐波的相位进行三次多项式插值,由公式: ...原创 2019-05-17 11:02:08 · 1692 阅读 · 0 评论 -
基音提取之短时自相关法
短时自相关函数的基音提取方法对于语音序列x(n),第i帧语音信号为,则短时自相关函数的定义为 k为时间延迟量。短时自相关函数的重要性质:1、若是周期信号,周期为T,则也是周期信号,且周期相同。 2、当...原创 2019-05-10 16:03:37 · 6184 阅读 · 1 评论 -
谐波加噪声模型-HNM
Stylianous提出了谐波加噪声模型(Harmonic Plus Noise Model,HNM)。将信号分成谐波成分和噪声成分,谐波成分代表信号中的低频部分,可以由基频、幅度、相位三个参数表示;噪声代表信号的高频部分,可由高斯白噪声通过高通滤波器来表示。谐波加噪声的数学描述如下: s(n)为语音信号,sh(n)为语音...原创 2019-05-13 22:40:53 · 2660 阅读 · 3 评论