一、实验原理
1. MPEG-1声音的主要性能
输入为PCM信号,采样率为32,44.1或48kHz,输出为 32kbps到384kbps。
2. MPEG音频编码主要流程
三个独立的压缩层次
Layer1:编码器最简单,384kbps(4:1, 用于小型数字盒带DCC,Compact Cassette)
Layer2:编码器复杂程度中等,256kbps~192kbps(6: 1~8:1, 用于DAB、CD-I和VCD)
Layer3:编码器最为复杂,64kbps,用于ISDN,网络 音频。
MPEG音频编码为同时获得较高的时域精准度与频域精准度,对信息分两条线即时域和频域分别处理,在综合获得最终结果。通过子带分析滤波器组使信号具有高的时间 分辨率,确保在短暂冲击信号情况下,编码 的声音信号具有足够高的质量; 使信号通过FFT运算具有高的频率分辨率,因为掩蔽阈值是从功率谱密度推出来的。流程图如下:
声音压缩算法属于感知编码,可以确立心理声学特性的模型来取消更 多的冗余数据。
3.心理声学模型 :
1.听觉系统中存在一个听觉阈值电平,低于这个电平的声 音信号就听不到 。听觉阈值的大小随声音频率的改变而改变,一个人是否听到声音取决于声音的频率,以及声音 的幅度是否高于这种频率下的听觉阈值 。
2.听觉掩蔽特性。即听觉阈值电平是自适应的,会随听到的不同频率声音而发生变化 。
4.频域掩蔽域随声压级变化曲线:
5.32个子带滤波器组:
通过子带分析滤波器组使信号具有高的时间分辨率,确保在短暂冲击信号情况下,编码的声音信号具有足够高的质量。将PCM样本变换到32个子带的频域信号:如果输入的采样频率为48kHz ,那么子带的频率宽度为48/ (2*32 )=0.75Hz
该多相滤波器组为如下图:
6.比例因子的取值和编码:

本文介绍了MPEG音频压缩编码的实验原理,包括MPEG-1声音的性能、编码流程、心理声学模型、比例因子计算、比特分配及编码、子带量化等关键步骤。实验结果以.txt文件形式输出。
最低0.47元/天 解锁文章
822

被折叠的 条评论
为什么被折叠?



