音频压缩技术全解析
1. 音频压缩基础与简单映射方法
音频压缩之所以可行,是因为声音及音频样本存在冗余性。一种简单的压缩方式是通过特定映射将高比特样本转换为低比特样本。例如,若取某个值(如 127),可将 16 比特样本映射为 8 比特样本,压缩比达到 0.5。然而,这种方式解码精度较低。像 16 比特样本 60100 映射为 8 比特数 113,解码后变为 60172;小样本 1000 映射为 1.35 并取整为 1,解码后为 742,与原样本差异明显。所以,压缩量应作为用户可控参数,这也是一种能提前知晓压缩比的压缩方法。
实际应用中,无需通过复杂公式计算,可提前制作样本映射表,实现快速编码和解码。
2. µ - 律和 A - 律压扩
2.1 基本原理与应用范围
µ - 律和 A - 律是国际标准采用的基于对数函数的音频压缩方法,用于综合业务数字网(ISDN)数字电话服务的非线性量化。ISDN 硬件每秒对电话语音信号采样 8000 次,生成 14 比特样本(A - 律为 13 比特)。µ - 律主要用于北美和日本,A - 律用于其他地区,二者主要区别在于量化方式(µ - 律为中平量化,A - 律为中升量化)。
实验表明,语音信号的低振幅部分包含更多信息,因此非线性量化具有合理性。例如,电话线上的音频信号数字化为 14 比特样本,对话音量越大,样本振幅和值越大。由于高振幅部分重要性较低,可进行粗量化;小样本则应精细量化以降低噪声。
2.2 编码器输入输出及参数
µ - 律编码器输入 14 比特样本,输出 8 比特码字;A - 律编码器输入 13 比特样本,同样输出 8
超级会员免费看
订阅专栏 解锁全文
7356

被折叠的 条评论
为什么被折叠?



