数据压缩实验六 MPEG音频压缩编码

最新推荐文章于 2023-12-29 18:11:30 发布

原创

最新推荐文章于 2023-12-29 18:11:30 发布 · 1.1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#数据压缩 #MPEG音频压缩编码 #感知音频编码 #c语言

本文介绍了MPEG音频压缩编码的实验原理，包括MPEG-1声音的性能、编码流程、心理声学模型、比例因子计算、比特分配及编码、子带量化等关键步骤。实验结果以.txt文件形式输出。

一、实验原理

1. MPEG-1声音的主要性能
输入为PCM信号，采样率为32，44.1或48kHz，输出为 32kbps到384kbps。

2. MPEG音频编码主要流程
三个独立的压缩层次
Layer1：编码器最简单，384kbps（4：1，用于小型数字盒带DCC，Compact Cassette）
Layer2：编码器复杂程度中等，256kbps～192kbps（6： 1～8：1，用于DAB、CD-I和VCD）
Layer3：编码器最为复杂，64kbps，用于ISDN，网络音频。

MPEG音频编码为同时获得较高的时域精准度与频域精准度，对信息分两条线即时域和频域分别处理，在综合获得最终结果。通过子带分析滤波器组使信号具有高的时间分辨率，确保在短暂冲击信号情况下，编码的声音信号具有足够高的质量；使信号通过FFT运算具有高的频率分辨率，因为掩蔽阈值是从功率谱密度推出来的。流程图如下：
这里写图片描述

声音压缩算法属于感知编码，可以确立心理声学特性的模型来取消更多的冗余数据。
3.心理声学模型：
1.听觉系统中存在一个听觉阈值电平，低于这个电平的声音信号就听不到。听觉阈值的大小随声音频率的改变而改变，一个人是否听到声音取决于声音的频率，以及声音的幅度是否高于这种频率下的听觉阈值。
2.听觉掩蔽特性。即听觉阈值电平是自适应的，会随听到的不同频率声音而发生变化。

4.频域掩蔽域随声压级变化曲线：
这里写图片描述

5.32个子带滤波器组：
通过子带分析滤波器组使信号具有高的时间分辨率，确保在短暂冲击信号情况下，编码的声音信号具有足够高的质量。将PCM样本变换到32个子带的频域信号：如果输入的采样频率为48kHz ，那么子带的频率宽度为48/ （2*32 ）=0.75Hz
该多相滤波器组为如下图：
这里写图片描述