语音处理信号滤波线性滤波器(笔记)

一堆定义

对各个定义的含义还是比较陌生:

Sound Pressure Level (SPL) 声音压力等级

Sound pressure is the local pressure deviationfrom the ambient atmospheric pressure caused by a sound wave
声压是由声波引起的局部压力与环境大气压的偏差
Sound pressure level (SPL) is a logarithmic measure of the sound ‘amplitude’ relative to a reference value
声压级是声音“幅度”相对于参考值的对数度量
A sound may be perceived as having ‘pitch’ and ‘timbre"
‘pitch’ 音高 ‘timbre" 音色

Frequency (f)
wavelength (λ)
sound velocity (v)
声音频率f 是每周期数(赫兹)
f = n/t = 1/T (Hz)
n 是时间 t 内的周期数,而 T是“周期”(一个周期的时间,以秒为单位)

波长λ 声速v
λ = v/f (m)
f = v/λ (Hz)

声音的种类:Impulsive, Noisy, Repetitive
最简单的重复信号是正弦波sinusoid,正弦波声音被称为纯音Pure Tone。

声波通过介质传播,相互干扰,当声波结合时,它们遵循叠加原理superposition principle
如果两个纯音具有相同的频率、幅度和相位,结果是具有两倍幅度的相同频率的纯音(相长干扰 constructive interference)
如果两个纯音具有相同的频率和幅度,但相位相反,它们会相互抵消(相消干涉 destructive interference)

Resonance 共振

当波遇到障碍物时,它们会被反射。
直接波和反射波结合(使用叠加原理)

  • 相长干涉导致共振 resonance(在特定频率上增强能量)
  • 相消干涉导致反共振 anti-resonance(在特定频率上减少能量)

隔音罩的共振特性取决于它们的 物理尺寸 和 表面反射特性。
简单的声学结构(例如管子)具有直接的共振特性。

v 声速
L 管子的长度
n 是正整数 (1, 2, 3 …)
n = 1 给出基波 fundamental的频率
n = 2, 3 给出谐波 harmonics的频率

两端开口的圆柱体的共振频率 f 为
f = n v 2 L f = \frac{nv}{2L} f=2Lnv
一端开口的圆柱体的共振频率 f 为
f = ( 2 n − 1 ) v 4 L f = \frac{(2n-1)v}{4L} f=4L2n1v

通用圆柱体的共振频率 f 为
f = ( 2 i − ( x 1 + x 2 ) ) c 4 L f = \frac{(2i-(x1+x2))c}{4L} f=4L2ix1+x2c
c 声速
L 管子的长度
i 是正整数 (1, 2, 3 …)
x1 是管一端的开口度 x2 是管另一端的开口度

neutral position (“uh”)

信号

信号是可以携带信息的物理量
离散信号选自有限字母表或密码本
连续信号源自一维标量scalar测量或者多维矢量vector测量

一些符号

(round) parentheses (圆形)括号
(squared) brackets(平方)括号
在这里插入图片描述

信号处理是对传感器数据的分析、解释和操作

Acoustic Signals 声音信号

物理系统可以
– 响应气压变化(例如麦克风)
– 产生气压变化(例如扬声器)
物理系统的机械特性会导致它们
oscillate 振荡(e.g. a tuning fork)音叉
resonate 共振 (e.g. an organ pipe)风琴管
当持续提供能量时,可以维持共振。当在有限的时间内提供能量时,将启动共振振荡,然后随时间衰减
信号类型:
Deterministic signals 确定性信号:aperiodic非周期性信号和periodic周期性信号
Non-deterministic signals 非确定性信号

White Noise 白噪音

白噪音是完全随机的信号
白噪声的特征是用平均值或者标准偏差(方差的平方)来表示的
白噪声可以遵循任意噪声分布,例如均匀分布,高斯(正态)分布
由恒定功率谱密度的描述和自相关函数:
在这里插入图片描述
在这里插入图片描述
除此还有高斯白噪音,二进制白噪音。
二进制白噪音的频谱和相关特性与高斯白噪音几乎没有区别,但是分布不同。

Stationary Signals固定信号

stationary signal 静止信号是一种特性不随时间变化的信号
– 恒定幅度和频率的正弦波
– 恒定均值和方差的噪声
Non-stationary signals 非静止信号随时间变化
– 幅度调制
– 频率调制
– 调制均值(和方差)
平稳信号意味着系统中存在恒定的能量源,如果系统中的能量衰减,信号将是非平稳的, 例如阻尼正弦波。

Quasi-Stationary Signals准静止信号

周期性、非周期性和随机信号的混合,因此它本质上是非平稳的。“准平稳”假设几乎用于所有语音信号处理任务。

Analogue,Digital Signals模拟与数字信号

信号量化和采样的过程被称为:pulse code modulation脉冲编码调制(PCM)
analogue-to-digital conversion 模数转换(ADC)
digital-to-analogue conversion 数模转换(DAC)
连续信号通过ADC转成采样信号再通过DAC 转成重构信号
Amplitude Quantisation 幅度量化, 可用于表示信号幅度的数字范围定义了系统的动态范围

Nyquist-Shannon 采样定理指出,我们需要每秒至少两倍的采样点数作为信号中的最高频率,对低于Nyquist速率的信号进行采样会导致混叠(频率高于采样率的能量被反射回较低的频率)
对连续信号 s(t) 进行采样相当于将其乘以狄拉克三角函数

Digital Speech Coding 数字语音编码

以较低速率对信号进行编码的方法是利用信号中的任何“冗余”
语音的最终预测模型是speech recognition语音识别+speech synthesis语音合成

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值