语音数字化、压缩及帧中继传输技术解析
1. 语音数字化与传统压缩技术
1.1 代数码激励线性预测(ACELP)
ACELP 在带宽方面实现了进一步提升,仅需 8 kbit/s 就能达到与 ADPCM 相当的效果。其代码本条目为代数表达式,而非一系列数字。这样的设计便于数字信号处理器(DSP)将其编码为数学函数,更轻松地处理语音形状,同时也减少了处理量和处理时间,有助于降低整体延迟。ITU G.729 定义的 ACELP 已被 FR 论坛技术委员会接受,成为帧中继语音(VoFR)的两种最低互操作性算法之一,并且还有专有实现方式。
1.2 自激声码器(SEV)
“声码器”是任何语音编码设备的通用术语。SEV 特别之处在于它创建和更新 CELP“候选激励向量”的方式。它没有固定的形状或向量代码本,而是根据模拟输入的近期样本块形状不断修订代码本。启动时,会有一个默认的随机形状列表来启动该过程。由于代码列表会根据当前流量不断调整,SEV 声称具有卓越的保真度和适应性,在低至 4800 bit/s 的编码速率下也能保证良好的质量。
1.3 混合激励线性预测(MELP)
MELP 在代码本组件中引入了非线性元素,例如允许非周期性脉冲序列,而不仅仅基于纯音(周期性重复)建模。在语音开始或结束时,非周期性脉冲可平滑从静音到有声的过渡,消除一些合成噪声。声源频率在再现声音中的分散进一步平滑了听众感知到的声音。MELP 还能在不同频段混合激励或源信号,减少再现语音中嗡嗡声或不需要音调的感知。此外,再现路径中的自适应滤波器提高了波形的准确性,使声音质量更自然,减少了“唐老鸭”般的失真。美国国防部选择 MELP 作为 2400 bit
超级会员免费看
订阅专栏 解锁全文
130

被折叠的 条评论
为什么被折叠?



