1、G.729编码前的原始音频是8k采样率,16bit数据
2、G.729编码时,通过算法,对原始音频进行压缩,压缩率为16:1
3、压缩是按帧进行的,1帧的时间是10ms。10ms的原始数据共80个样品x16bit=1280 bit,通过算法编码之后,得到新的数据为80bit(10个字节Byte)。
4、每一帧的处理时间控制为5ms,则其时延相当于10ms+5ms=15ms
最终音频流相当于 8kbps。
注:G.729选择8k采样率,也是基于人讲话声音频率通常落在500Hz-3kHz(另一说<3.4kHz)。
本文介绍了G.729音频编码技术,该技术将8k采样率、16bit的原始音频压缩至16:1,每帧10ms,压缩后为80bit。处理时间控制在5ms,总时延15ms,生成的音频流为8kbps。G.729编码选择8k采样率基于人声频谱特性。

被折叠的 条评论
为什么被折叠?



