上次我们介绍了RTC通讯中常用的图像格式,这次我们来介绍一下RTC通讯中常用的音频格式。
一,概述
音频格式有哪些?要回答这个问题,先来给大家看一下百度百科对音频的解释:音频格式即音乐格式。音频格式是指要在计算机内播放或是处理音频文件,是对声音文件进行数、模转换的过程。音频格式最大带宽是20KHZ,速率介于40-50KHZ之间,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。人们说话的声音频谱能量范围大部分分布在300-3400HZ,而人耳能听到声音的频谱范围一般为20~20000HZ,所以人耳是可以听到除人说话外的自然界的很多其他声音的,像乐器,自然界,尖鸣声等等。
通讯发展经历了几个阶段-飞鸽传输-烽火台-消息(电报)-语音通话-视频通话-AR/VR,从之前的文字通讯发展到现在的音视频通讯,而且随着时代的发展,人们已经不再满足于简单的能听到对方的声音,现在对于声音的音质,立体声甚至空间环绕声都有着强烈的需求场景;所以也需要各种音频格式与之相匹配,才能满足现实场景中的需求。
二,常用的音频格式
就目前的音频市场来看,音频格式主要分为两种:无损压缩何有损压缩。如果我们听不同格式的音频,音质上也会有比较大的差异。无损压缩的音频能在百分百保存源文件的所有数据的基础上,将音频文件的体积压缩的更小,然后将压缩的音频文件还原后,就能实现与源文件相同的大小、相同的码率。还有一种就是有损压缩的音频,这种就是降低音频采样频率与比特率,这样输出的音频文件会比源文件晓。
1、MP3 ——没有比这更熟悉的名字:MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用 *.mp3 格式来储存,一般只有 *.wav 文件的1/10,因而音质要次于CD格式或WAV格式的声音文件。
2、PCM ——最常用的音频格式:PCM中文称脉冲编码调制(Pulse Code Modulation