PCM 是 Pulse Code Modulation 的缩写,它的中文含义是脉冲编码调制。什么叫做脉冲编码调制呢?在将模拟信号转化为数字信号的过程中,由于模拟信号是连续的信号而数字信号是离散的信号, 要使得转换后的数字信号能够还原成模拟信号,我们可以这样想:设置一个间隔时间非常小的脉冲信号发生仪(假设为 0.000001 毫秒) ,当每一次脉冲到来的时候,我们采集此时的模拟信号的电压值,循环这个过程,我们将采集到很多个小时刻的电压值,如果将这些采集到的电压值重新在坐标上表示出来,将发现它所形成的曲线的样子和原来的模拟信号的曲线非常的相似。 这就是简单的模拟信号到数字信号的转换过程。
标准的录音机或者是其他程序从声卡抓取的声音,最原始的音频数据以xKxbit采样,生成的PCM格式文件,没有经过任何的压缩编码,最原始的数据。所以我觉得RAW应该与PCM是等同。
原始采样不一定是8k16bit,但是 G711,G729压缩编码前输入的数据格式必须是8k16bit,16bit线性。
G.711 还是与PCM不同的,它有两个编码方式:一种是a-law,另一种mu-law,
压缩比是2:1, 是将原始数据(pcm)8k16bit,128kbps 压缩编码后生产8k8bit, 64kbps 的语音编码,采用波形编码的编码器
G.729 压缩比是16:1,原始数据8k16bit,128kbps 压缩编码后 8kbps,采用CELP模型编码的编码器。
iSAC Internet Speech Audio Codec
针对VoIP和音频流的宽带和超宽带音频编解码器,是WebRTC音频引擎的默认的编解码器
采样频率:16khz,24khz,32khz;(默认为16khz)
自适应速率为10kbit/s ~ 52kbit/;
自适应包大小:30~60ms;帧率
算法延时:frame + 3ms
这种根据带宽动态调节自适应的编码器,应用时采样率是固定的,先期从声卡采数据时就会设定好,
帧率多少毫秒一个包猜测也应该是固定的。
动态改变的应该是压缩算法,带宽好的时候用损失率小的压缩算法,不好的时候用压缩率大的算法。
iLBC Internet Low Bitrate Codec VoIP音频流的窄带语音编解码器
采样频率:8khz;
20ms帧比特率为15.2kbps
30ms帧比特率为13.33kbps
标准由IETF RFC3951和RFC3952定义
语音编码
最新推荐文章于 2024-06-25 14:55:58 发布