【实验六】MPEG音频编码实验

最新推荐文章于 2022-07-16 20:43:15 发布

原创最新推荐文章于 2022-07-16 20:43:15 发布 · 314 阅读

0 ·

CC 4.0 BY-SA版权

数据压缩专栏收录该内容

10 篇文章

订阅专栏

本文详细介绍了MPEG-1 Audio Layer II编码器的工作原理，包括子带编码与感知音频编码两大核心模块。通过心理声学模型去除冗余信息，并探讨了时频矛盾点及码率分配策略。同时展示了针对不同音频源的编码实现结果。

一、MPEG-1 Audio LayerII编码器原理

该编码器由两部分并行构成，一部分是子带编码系统，另一部分是感知音频编码系统。
在这里插入图片描述

1. 子带编码

将原始信号分解为若干个子频带，对其分别编码处理后再合成为全频带信号

1.1 多相滤波器组

在这里插入图片描述
将PCM样本变换到32个子带的频域信号。

2. 感知音频编码

核心思想：去除无法被人耳感知的部分，即去除冗余信息。
时频矛盾点：
子带编码系统中子带应该粗分，以让时域具有较高的分辨率。确保在短暂冲激信号情况下，编码的声音具有较高的质量。感知音频编码系统中，信号在FFT处应该提高频率分辨率。

2.1 心理声学模型

听觉阈值
听觉系统存在一听觉阈值电平。如下图所示，当电平低于蓝线时，人耳无法感知。
在这里插入图片描述 听觉掩蔽特性
听觉阈值不是固定的，随听到的不同频率声音而发生变化。

2.2 掩蔽值计算思路

在这里插入图片描述
临界频带
当某个纯音被以它为中心频率，且具有一定带宽的连续噪声所掩蔽时，若果该纯银呢刚好被听到时的功率等于这一频带内的噪声功率，这个带宽为临界频带宽度。

2.3 码率分配的实现思路

NMR=SMR−SNR(dB)
即噪声比等于信噪比减去信掩比。
在这里插入图片描述
使整个一帧和每个子带的掩噪比最小。这是一个循环过程，每一次为最高NMR的子带分配比特，即使获益最大的子带的量化级别增加一级，当然所用比特数不能超过一帧所能提供的最大数目。

二、代码实现

1. 代码解析

新生成一个Trace文件，用于保存输出数据。

	fprintf(Trace, "---------音频信息---------\n", nch);
	fprintf(Trace, "该音频声道数：%d\n", nch);
	fprintf(Trace, "观测第 %d 帧\n", frameNum);
	fprintf(Trace, "本帧比特预算：%d bits\n", adb);
	fprintf(Trace, "-----------------------");
	fprintf(Trace, "---------比例因子---------\n");
	for (ch = 0; ch < nch; ch++)	// 每个声道单独输出
	{
		fprintf(Trace, "--- 声道%2d ----\n", ch + 1);
		for (sb = 0; sb < frame.sblimit; sb++)	// 每个子带
		{
			fprintf(Trace, "子带[%2d]:\t", sb + 1);
			for (int gr = 0; gr < 3; gr++) {
				fprintf(Trace, "%2d\t", scalar[ch][gr][sb]);
			}
			fprintf(Trace, "\n");
		}
	}
	fprintf(Trace, "\n");


	fprintf(Trace, "--------- 比特分配表 ---------\n");  //输出比特分配结果
	for (ch = 0; ch < nch; ch++) {
		fprintf(Trace, "--- 声道%2d ---\n", ch + 1); //按声道分配
		for (sb = 0; sb < frame.sblimit; sb++) {
			fprintf(Trace, "子带[%2d]:\t%2d\n", sb + 1, bit_alloc[ch][sb]);
		}
		fprintf(Trace, "\n");
	}

2. 输出文件

2.1 音乐

文件名: 'music2.WAV
采样率: 44.1 kHz
目标码率: 192 kbps
bits allocated in the frame No.1 is 5008
---------音频信息---------
该音频声道数：1
观测第 1 帧
本帧比特预算：8 bits
--------------------------------比例因子---------
— 声道 1 ----
子带[ 1]: 11 11 11
子带[ 2]: 12 12 12
子带[ 3]: 21 18 18
子带[ 4]: 25 25 25
子带[ 5]: 29 29 29
子带[ 6]: 28 23 26
子带[ 7]: 22 22 22
子带[ 8]: 21 21 21
子带[ 9]: 32 28 28
子带[10]: 34 30 30
子带[11]: 31 31 31
子带[12]: 30 30 26
子带[13]: 27 24 24
子带[14]: 23 23 23
子带[15]: 26 22 25
子带[16]: 30 25 25
子带[17]: 26 26 26
子带[18]: 29 29 29
子带[19]: 31 31 30
子带[20]: 26 26 26
子带[21]: 34 34 31
子带[22]: 34 31 31
子带[23]: 38 38 38
子带[24]: 39 50 50
子带[25]: 43 51 57
子带[26]: 41 54 54
子带[27]: 45 52 52
子带[28]: 42 54 54
子带[29]: 44 52 52
子带[30]: 43 52 52
--------- 比特分配表 ---------
— 声道 1 —
子带[ 1]: 8
子带[ 2]: 8
子带[ 3]: 6
子带[ 4]: 8
子带[ 5]: 7
子带[ 6]: 8
子带[ 7]: 8
子带[ 8]: 6
子带[ 9]: 5
子带[10]: 6
子带[11]: 6
子带[12]: 7
子带[13]: 6
子带[14]: 6
子带[15]: 6
子带[16]: 5
子带[17]: 5
子带[18]: 5
子带[19]: 4
子带[20]: 6
子带[21]: 3
子带[22]: 3
子带[23]: 0
子带[24]: 0
子带[25]: 0
子带[26]: 0
子带[27]: 0
子带[28]: 0
子带[29]: 0
子带[30]: 0

2.2 噪声

文件名: 'zao.m4a
采样率: 44.1 kHz
目标码率: 192 kbps
bits allocated in the frame No.1 is 5008
---------音频信息---------
该音频声道数：2
观测第 1 帧
本帧比特预算：4 bits
--------------------------------比例因子---------
— 声道 1 ----
子带[ 1]: 7 11 3
子带[ 2]: 10 15 7
子带[ 3]: 12 16 13
子带[ 4]: 12 21 10
子带[ 5]: 12 17 17
子带[ 6]: 11 17 12
子带[ 7]: 13 17 17
子带[ 8]: 11 14 14
子带[ 9]: 14 14 14
子带[10]: 14 14 14
子带[11]: 14 14 14
子带[12]: 15 15 15
子带[13]: 11 16 16
子带[14]: 11 11 17
子带[15]: 13 13 13
子带[16]: 14 14 14
子带[17]: 14 14 14
子带[18]: 13 13 13
子带[19]: 13 16 20
子带[20]: 13 17 17
子带[21]: 14 14 14
子带[22]: 11 15 15
子带[23]: 14 18 21
子带[24]: 14 14 14
子带[25]: 11 15 18
子带[26]: 13 13 19
子带[27]: 12 15 15
子带[28]: 13 13 13
子带[29]: 13 17 17
子带[30]: 14 14 21
— 声道 2 ----
子带[ 1]: 6 2 2
子带[ 2]: 10 3 7
子带[ 3]: 12 12 12
子带[ 4]: 10 10 10
子带[ 5]: 10 10 18
子带[ 6]: 12 9 12
子带[ 7]: 12 12 12
子带[ 8]: 10 10 10
子带[ 9]: 15 8 16
子带[10]: 14 14 14
子带[11]: 13 10 16
子带[12]: 13 10 18
子带[13]: 10 13 16
子带[14]: 12 12 16
子带[15]: 17 14 14
子带[16]: 14 14 14
子带[17]: 12 12 12
子带[18]: 13 13 17
子带[19]: 13 13 13
子带[20]: 10 10 10
子带[21]: 15 12 20
子带[22]: 12 12 12
子带[23]: 13 13 13
子带[24]: 13 13 21
子带[25]: 12 12 16
子带[26]: 14 14 20
子带[27]: 12 12 12
子带[28]: 14 14 14
子带[29]: 12 12 18
子带[30]: 13 13 13
--------- 比特分配表 ---------
— 声道 1 —
子带[ 1]: 7
子带[ 2]: 6
子带[ 3]: 4
子带[ 4]: 6
子带[ 5]: 5
子带[ 6]: 5
子带[ 7]: 4
子带[ 8]: 5
子带[ 9]: 4
子带[10]: 4
子带[11]: 3
子带[12]: 3
子带[13]: 4
子带[14]: 4
子带[15]: 3
子带[16]: 2
子带[17]: 3
子带[18]: 3
子带[19]: 3
子带[20]: 2
子带[21]: 1
子带[22]: 3
子带[23]: 2
子带[24]: 2
子带[25]: 2
子带[26]: 1
子带[27]: 2
子带[28]: 1
子带[29]: 2
子带[30]: 0
— 声道 2 —
子带[ 1]: 4
子带[ 2]: 4
子带[ 3]: 3
子带[ 4]: 5
子带[ 5]: 5
子带[ 6]: 5
子带[ 7]: 4
子带[ 8]: 5
子带[ 9]: 4
子带[10]: 4
子带[11]: 3
子带[12]: 3
子带[13]: 4
子带[14]: 4
子带[15]: 3
子带[16]: 2
子带[17]: 3
子带[18]: 3
子带[19]: 3
子带[20]: 2
子带[21]: 1
子带[22]: 3
子带[23]: 2
子带[24]: 2
子带[25]: 2
子带[26]: 1
子带[27]: 2
子带[28]: 1
子带[29]: 2
子带[30]: 0

2.3音乐+噪声

文件名: 'music+zao.WAV
采样率: 22.1 kHz
目标码率: 96 kbps
bits allocated in the frame No.1 is 5008
---------音频信息---------
该音频声道数：1
观测第 1 帧
本帧比特预算：17 bits
--------------------------------比例因子---------
— 声道 1 ----
子带[ 1]: 10 10 10
子带[ 2]: 10 10 10
子带[ 3]: 11 11 11
子带[ 4]: 10 10 10
子带[ 5]: 15 9 9
子带[ 6]: 11 11 11
子带[ 7]: 11 11 11
子带[ 8]: 12 12 12
子带[ 9]: 11 11 11
子带[10]: 11 11 11
子带[11]: 12 12 10
子带[12]: 13 10 10
子带[13]: 11 11 11
子带[14]: 12 12 9
子带[15]: 12 12 12
子带[16]: 11 11 11
子带[17]: 11 11 11
子带[18]: 12 12 12
子带[19]: 12 8 8
子带[20]: 12 12 9
子带[21]: 9 9 9
子带[22]: 13 7 7
子带[23]: 15 11 11
子带[24]: 11 11 11
子带[25]: 12 12 12
子带[26]: 11 11 11
子带[27]: 15 12 12
子带[28]: 12 12 12
子带[29]: 14 11 11
子带[30]: 11 11 11
--------- 比特分配表 ---------
— 声道 1 —
子带[ 1]: 7
子带[ 2]: 8
子带[ 3]: 7
子带[ 4]: 8
子带[ 5]: 6
子带[ 6]: 6
子带[ 7]: 6
子带[ 8]: 5
子带[ 9]: 5
子带[10]: 5
子带[11]: 5
子带[12]: 3
子带[13]: 3
子带[14]: 3
子带[15]: 3
子带[16]: 3
子带[17]: 3
子带[18]: 3
子带[19]: 3
子带[20]: 3
子带[21]: 3
子带[22]: 3
子带[23]: 3
子带[24]: 3
子带[25]: 3
子带[26]: 3
子带[27]: 3
子带[28]: 3
子带[29]: 3
子带[30]: 3