一堆定义
对各个定义的含义还是比较陌生:
Sound Pressure Level (SPL) 声音压力等级
Sound pressure is the local pressure deviationfrom the ambient atmospheric pressure caused by a sound wave
声压是由声波引起的局部压力与环境大气压的偏差
Sound pressure level (SPL) is a logarithmic measure of the sound ‘amplitude’ relative to a reference value
声压级是声音“幅度”相对于参考值的对数度量
A sound may be perceived as having ‘pitch’ and ‘timbre"
‘pitch’ 音高 ‘timbre" 音色
Frequency (f)
wavelength (λ)
sound velocity (v)
声音频率f 是每周期数(赫兹)
f = n/t = 1/T (Hz)
n 是时间 t 内的周期数,而 T是“周期”(一个周期的时间,以秒为单位)
波长λ 声速v
λ = v/f (m)
f = v/λ (Hz)
声音的种类:Impulsive, Noisy, Repetitive
最简单的重复信号是正弦波sinusoid,正弦波声音被称为纯音Pure Tone。
声波通过介质传播,相互干扰,当声波结合时,它们遵循叠加原理superposition principle
如果两个纯音具有相同的频率、幅度和相位,结果是具有两倍幅度的相同频率的纯音(相长干扰 constructive interference)
如果两个纯音具有相同的频率和幅度,但相位相反,它们会相互抵消(相消干涉 destructive interference)
Resonance 共振
当波遇到障碍物时,它们会被反射。
直接波和反射波结合(使用叠加原理)
- 相长干涉导致共振 resonance(在特定频率上增强能量)
- 相消干涉导致反共振 anti-resonance(在特定频率上减少能量)
隔音罩的共振特性取决于它们的 物理尺寸 和 表面反射特性。
简单的声学结构(例如管子)具有直接的共振特性。
v 声速
L 管子的长度
n 是正整数 (1, 2, 3 …)
n = 1 给出基波 fundamental的频率
n = 2, 3 给出谐波 harmonics的频率
两端开口的圆柱体的共振频率 f 为
f = n v 2 L f = \frac{nv}{2L} f=2Lnv
一端开口的圆柱体的共振频率 f 为
f = ( 2 n − 1 ) v 4 L f = \frac{(2n-1)v}{4L} f=4L(2n−1)v
通用圆柱体的共振频率 f 为
f = ( 2 i − ( x 1 + x 2 ) ) c 4 L f = \frac{(2i-(x1+x2))c}{4L} f=4L(2i−(x1+x2))c
c 声速
L 管子的长度
i 是正整数 (1, 2, 3 …)
x1 是管一端的开口度 x2 是管另一端的开口度
neutral position (“uh”)
信号
信号是可以携带信息的物理量
离散信号选自有限字母表或密码本
连续信号源自一维标量scalar测量或者多维矢量vector测量
一些符号
(round) parentheses (圆形)括号
(squared) brackets(平方)括号
信号处理是对传感器数据的分析、解释和操作
Acoustic Signals 声音信号
物理系统可以
– 响应气压变化(例如麦克风)
– 产生气压变化(例如扬声器)
物理系统的机械特性会导致它们
oscillate 振荡(e.g. a tuning fork)音叉
resonate 共振 (e.g. an organ pipe)风琴管
当持续提供能量时,可以维持共振。当在有限的时间内提供能量时,将启动共振振荡,然后随时间衰减
信号类型:
Deterministic signals 确定性信号:aperiodic非周期性信号和periodic周期性信号
Non-deterministic signals 非确定性信号
White Noise 白噪音
白噪音是完全随机的信号
白噪声的特征是用平均值或者标准偏差(方差的平方)来表示的
白噪声可以遵循任意噪声分布,例如均匀分布,高斯(正态)分布
由恒定功率谱密度的描述和自相关函数:
除此还有高斯白噪音,二进制白噪音。
二进制白噪音的频谱和相关特性与高斯白噪音几乎没有区别,但是分布不同。
Stationary Signals固定信号
stationary signal 静止信号是一种特性不随时间变化的信号
– 恒定幅度和频率的正弦波
– 恒定均值和方差的噪声
Non-stationary signals 非静止信号随时间变化
– 幅度调制
– 频率调制
– 调制均值(和方差)
平稳信号意味着系统中存在恒定的能量源,如果系统中的能量衰减,信号将是非平稳的, 例如阻尼正弦波。
Quasi-Stationary Signals准静止信号
周期性、非周期性和随机信号的混合,因此它本质上是非平稳的。“准平稳”假设几乎用于所有语音信号处理任务。
Analogue,Digital Signals模拟与数字信号
信号量化和采样的过程被称为:pulse code modulation脉冲编码调制(PCM)
analogue-to-digital conversion 模数转换(ADC)
digital-to-analogue conversion 数模转换(DAC)
连续信号通过ADC转成采样信号再通过DAC 转成重构信号
Amplitude Quantisation 幅度量化, 可用于表示信号幅度的数字范围定义了系统的动态范围
Nyquist-Shannon 采样定理指出,我们需要每秒至少两倍的采样点数作为信号中的最高频率,对低于Nyquist速率的信号进行采样会导致混叠(频率高于采样率的能量被反射回较低的频率)
对连续信号 s(t) 进行采样相当于将其乘以狄拉克三角函数
Digital Speech Coding 数字语音编码
以较低速率对信号进行编码的方法是利用信号中的任何“冗余”
语音的最终预测模型是speech recognition语音识别+speech synthesis语音合成