
语音增强
文章平均质量分 86
叶夜笙歌
关注IT、智能硬件行业,专业语音信号处理,在此记录整理一些东西,让自己理解更深,也让大家分享,错漏之处,不吝赐教。
展开
-
自适应波束形成(五)——Frost波束形成2
上篇是对matlab模拟产生的阵列接收语音进行增强,这篇主要是利用Frost波束形成器对真实信号进行增强。1 测试环境 采集环境为6*3.7*3.4m3的测试室,用恒通DAR2000多路音频采集卡(如图1左),通过D型音频接线口与由烽火PK-080VH微型数字针孔拾音器(如图1右)组成的麦克风阵列相连,采集8路真实语音信号进行语音增强测试。原创 2014-03-28 16:21:10 · 6665 阅读 · 5 评论 -
自适应波束形成(四)——Frost波束形成1
1 算法原理 LCMV波束形成器最优权向量的求解依赖于阵列接收数据的统计知识,即要计算自相关Rx。然而,实际应用中阵列接收数据的自相关是未知的或是时变的,此时约束自适应算法能用来逼近权向量,即Frost波束形成器。 首先,初始化权向量w[0] = C(CHC)-1f,它满足约束条件。然后以一个适当的比例系数朝Rxxw+Cλ 负梯度方向迭代,得到原创 2014-03-28 15:04:19 · 12742 阅读 · 7 评论 -
语音增强简介
大四上研究过一段时间NLMS,之后直到研一上做的都是关于麦克风阵列的语音增强,感觉时间久了又会记不太清楚,所以稍微整理下。1 单麦克风语音增强 麦克风,又称话筒或传声器,是一种将模拟声音信号转换成数字电子信号的换能器。按声场作用力麦克风可分为压强式麦克风、压差式麦克风和压强压差组合式麦克风。我们常用的麦克风就是压强式麦克风。用单麦克风对语音进行增强,可通过物理结构和原创 2014-03-17 15:04:49 · 7072 阅读 · 1 评论 -
语音的基础知识
1 语音信号的处理基础(1) 语音信号的产生模型 语音是由发生器官产生的。肺呼进空气,由气管呼出形成气流,气流经由声门,使声带振动,产生一系列离散脉冲,再经由咽腔和口腔,有时还经由鼻腔。随着发音的不同,口的张合程度不同,舌在口中位置的不同,气流经过各容积不断变化的空腔时产生许多共振,最后从口和鼻以声波的形式辐射出来。 因此,可将语音的频谱写成 F(w) =原创 2014-03-19 14:13:41 · 2965 阅读 · 0 评论 -
麦克风阵列原理
1 麦克风阵列 麦克风阵列,是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对空间传播声音信号进行空间采样的一种装置,采集到的信号包含了其空间位置信息。根据声源和麦克风阵列之间距离的远近,可将阵列分为近场模型和远场模型。根据麦克风阵列的拓扑结构,则可分为线性阵列、平面阵列、体阵列等。(1) 近场模型和远场模型 声波是纵波,即媒质中质点沿传原创 2014-03-19 14:55:22 · 12114 阅读 · 3 评论 -
自适应波束形成(一)——窄带波束形成和宽带波束形成
在许多波束形成应用中,我们经常需要根据接收到的阵列数据来更新波束形成器系数,以获得不同情境下的最优解决方案。若环境是变化的,系数也要自适应变化,这就是自适应波束形成器。 运用波束形成技术,利用麦克风阵列估计指定方向上的混有噪声和干扰的期望信号。这些麦克风阵元位于不同的空间位置,对声波进行空间采样,然后对采样信号进行处理以衰减干扰信号并提取期望信号。这样就得到一个特定的阵列空间响应原创 2014-03-21 14:27:25 · 23409 阅读 · 3 评论 -
自适应波束形成(二)——时域窄带LCMV波束形成器
1 算法原理 如果期望信号的到达角和带宽范围已知,那么可以先对阵列接收数据进行时延补偿,使阵列对期望信号的接收保持一致性,然后对阵列系数强加约束条件以自适应的使波束形成器输出能量E{y(t)*y(t)}最小,等效于使输出信号中非期望方向的噪声能量最小,从而达到增强期望方向信号的目的。这就是线性约束最小方差(LCMV)波束形成器。 波束形成器的响应是频率ω和到达角原创 2014-03-26 14:25:34 · 15457 阅读 · 16 评论 -
自适应波束形成(三)——频域宽带LCMV波束形成器
为了将窄带波束形成扩展至宽带,可以使用频域LCMV波束形成器。首先将麦克风阵列各阵元接收到的信号进行时延补偿,做DFT变换到频域,然后在频域内划分子频带,在每个子频带内运用窄带LCVM算法,最后将得到的结果做IDFT逆变换回时域。尽管频域LCMV波束形成器会降低收敛速度,但可以减少计算复杂度。1 算法原理 频域LCMV波束形成器的结构如图1所示。原创 2014-03-26 14:51:25 · 17657 阅读 · 23 评论 -
语音增强噪声类型及评估方法
语音增强属于数字信号处理中的语音信号处理领域。1、简介1.1 噪声类型 语音增强的目的是提高语音信号的质量或可懂度,减少失真。这里主要介绍单麦克风信号语音增强,常见的失真有: (a) 加性声学噪声:就是麦克风在录制语音时同时录制进去的背景环境声音 (b) 声学混响:多径反射引起的叠加效应 (c) 卷积信道效应:导致不均匀或带宽原创 2016-04-12 09:18:06 · 8101 阅读 · 1 评论