实验原理
下图为MPEG音频编码layerII流程图:
32个子带滤波器组:
通过子带分析滤波器组使信号具有高的时间分辨率,确保在短暂冲击信号情况下,编码的声音信号具有足够高的质量。
将PCM样本变换到32个子带的频域信号:如果输入的采样频率为48kHz ,那么子带的频率宽度为48/ (2*32 )=0.75Hz
该多相滤波器组为如下图:
心理声学模型:
计算信号中不可听觉感知的部分。
时频分析的矛盾:
1、通过子带分析滤波器组使信号具有高的时间分辨率,确保在短暂冲击信号情况下,编码的声音信号具有足够高的质量
2、又可以使信号通过FFT运算具有高的频率分辨率,因为掩蔽阈值是从功率谱密度推出来的。
2、又可以使信号通过FFT运算具有高的频率分辨率,因为掩蔽阈值是从功率谱密度推出来的。
在低频子带中,为了保护音调和共振峰的结构,就要求用较小的量化阶、较多的量化级数,即分配较多的位数来表示样本值。而话音中的摩擦音和类似噪声的声音,通常出现在高频子带中,对它分配较少的位数。
步骤:
将样本变换到频域->确定声压级别->考虑安静时阈值->将音频信号分解成“乐音(tones)” 和“非乐音/噪声”部分:因为两种信号的掩蔽能力不同->音调和非音调掩蔽成分的消除->单个掩蔽阈值的计算->全局掩蔽阈值的计算->每个子带的掩蔽阈值->计算每个子带信号掩蔽比(signal-to-maskratio, SMR)

本次实验报告详细介绍了MPEG音频编码的原理,包括32个子带滤波器组用于提高时间分辨率,以及心理声学模型在比特分配过程中的应用。实验流程涵盖理解程序设计框架、感知音频编码思想、心理声学模型和码率分配的实现。通过关键代码分析,得出实验结果并进行了深入的讨论。
最低0.47元/天 解锁文章
1037

被折叠的 条评论
为什么被折叠?



