MPEG音频编码实验报告

最新推荐文章于 2022-07-15 22:32:35 发布

原创

最新推荐文章于 2022-07-15 22:32:35 发布 · 1.1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本次实验报告详细介绍了MPEG音频编码的原理，包括32个子带滤波器组用于提高时间分辨率，以及心理声学模型在比特分配过程中的应用。实验流程涵盖理解程序设计框架、感知音频编码思想、心理声学模型和码率分配的实现。通过关键代码分析，得出实验结果并进行了深入的讨论。

实验原理

下图为MPEG音频编码layerII流程图：

32个子带滤波器组：

通过子带分析滤波器组使信号具有高的时间分辨率，确保在短暂冲击信号情况下，编码的声音信号具有足够高的质量。

将PCM样本变换到32个子带的频域信号：如果输入的采样频率为48kHz ，那么子带的频率宽度为48/ （2*32 ）=0.75Hz

该多相滤波器组为如下图：

心理声学模型：

计算信号中不可听觉感知的部分。

时频分析的矛盾：

1、通过子带分析滤波器组使信号具有高的时间分辨率，确保在短暂冲击信号情况下，编码的声音信号具有足够高的质量
2、又可以使信号通过FFT运算具有高的频率分辨率，因为掩蔽阈值是从功率谱密度推出来的。

在低频子带中，为了保护音调和共振峰的结构，就要求用较小的量化阶、较多的量化级数，即分配较多的位数来表示样本值。而话音中的摩擦音和类似噪声的声音，通常出现在高频子带中，对它分配较少的位数。

步骤：

将样本变换到频域->确定声压级别->考虑安静时阈值->将音频信号分解成“乐音(tones)” 和“非乐音/噪声”部分：因为两种信号的掩蔽能力不同->音调和非音调掩蔽成分的消除->单个掩蔽阈值的计算->全局掩蔽阈值的计算->每个子带的掩蔽阈值->计算每个子带信号掩蔽比(signal-to-maskratio, SMR)

比特分配过程：

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。