55、音频压缩技术全解析

音频压缩技术全解析

1. 音频压缩基础与简单映射方法

音频压缩之所以可行,是因为声音及音频样本存在冗余性。一种简单的压缩方式是通过特定映射将高比特样本转换为低比特样本。例如,若取某个值(如 127),可将 16 比特样本映射为 8 比特样本,压缩比达到 0.5。然而,这种方式解码精度较低。像 16 比特样本 60100 映射为 8 比特数 113,解码后变为 60172;小样本 1000 映射为 1.35 并取整为 1,解码后为 742,与原样本差异明显。所以,压缩量应作为用户可控参数,这也是一种能提前知晓压缩比的压缩方法。

实际应用中,无需通过复杂公式计算,可提前制作样本映射表,实现快速编码和解码。

2. µ - 律和 A - 律压扩

2.1 基本原理与应用范围

µ - 律和 A - 律是国际标准采用的基于对数函数的音频压缩方法,用于综合业务数字网(ISDN)数字电话服务的非线性量化。ISDN 硬件每秒对电话语音信号采样 8000 次,生成 14 比特样本(A - 律为 13 比特)。µ - 律主要用于北美和日本,A - 律用于其他地区,二者主要区别在于量化方式(µ - 律为中平量化,A - 律为中升量化)。

实验表明,语音信号的低振幅部分包含更多信息,因此非线性量化具有合理性。例如,电话线上的音频信号数字化为 14 比特样本,对话音量越大,样本振幅和值越大。由于高振幅部分重要性较低,可进行粗量化;小样本则应精细量化以降低噪声。

2.2 编码器输入输出及参数

µ - 律编码器输入 14 比特样本,输出 8 比特码字;A - 律编码器输入 13 比特样本,同样输出 8

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值