5、语音数字化、压缩及帧中继传输技术解析

最新推荐文章于 2025-10-17 04:39:11 发布

gin88

最新推荐文章于 2025-10-17 04:39:11 发布

阅读量33

点赞数

CC 4.0 BY-SA版权

分类专栏： VoFR技术重塑语音网络文章标签：语音数字化压缩技术 ACELP

本文链接：https://blog.youkuaiyun.com/gin88/article/details/153447104

VoFR技术重塑语音网络专栏收录该内容

15 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

语音数字化、压缩及帧中继传输技术解析

1. 语音数字化与传统压缩技术

1.1 代数码激励线性预测（ACELP）

ACELP 在带宽方面实现了进一步提升，仅需 8 kbit/s 就能达到与 ADPCM 相当的效果。其代码本条目为代数表达式，而非一系列数字。这样的设计便于数字信号处理器（DSP）将其编码为数学函数，更轻松地处理语音形状，同时也减少了处理量和处理时间，有助于降低整体延迟。ITU G.729 定义的 ACELP 已被 FR 论坛技术委员会接受，成为帧中继语音（VoFR）的两种最低互操作性算法之一，并且还有专有实现方式。

1.2 自激声码器（SEV）

“声码器”是任何语音编码设备的通用术语。SEV 特别之处在于它创建和更新 CELP“候选激励向量”的方式。它没有固定的形状或向量代码本，而是根据模拟输入的近期样本块形状不断修订代码本。启动时，会有一个默认的随机形状列表来启动该过程。由于代码列表会根据当前流量不断调整，SEV 声称具有卓越的保真度和适应性，在低至 4800 bit/s 的编码速率下也能保证良好的质量。

1.3 混合激励线性预测（MELP）

MELP 在代码本组件中引入了非线性元素，例如允许非周期性脉冲序列，而不仅仅基于纯音（周期性重复）建模。在语音开始或结束时，非周期性脉冲可平滑从静音到有声的过渡，消除一些合成噪声。声源频率在再现声音中的分散进一步平滑了听众感知到的声音。MELP 还能在不同频段混合激励或源信号，减少再现语音中嗡嗡声或不需要音调的感知。此外，再现路径中的自适应滤波器提高了波形的准确性，使声音质量更自然，减少了“唐老鸭”般的失真。美国国防部选择 MELP 作为 2400 bit

会员秒杀 ¥9.9 重磅福利

超级会员免费看