目录
1. 用二级制来表示音频
声音是由物体的振动来表示的,振动是一种连续的波形,因此声音信息是一种模拟信号。但是计算机所能够表示的信息都是离散的,只能处理离散的数字信号,因此需要对于声音进行一定的处理,将模拟信号转换为数字信号。
其中最重要的有三步:采样、量化和编码。流程如下所示:

1.1 采样
采样是将模拟信号转换为数字信号的第一步,通过固定间隔内”捕捉“音频信号的平均值来完成这一目标。
对于一段连续的音频,首先将其拆分为很多份的,每一份都需要记录一个平均振幅。每秒采集样本的次数称为采样率,通常是以赫兹(Hz)位单位。拆分的过程中通常会产生信息丢失,因此采样率越大,信息丢失越小,音频的还原程度越高,但同时也会增加数据量。计算机中使用二进制来表示一个采样点的振幅,例如8位的二进制来表示一个采样点振幅,可以使用0~255来表示一个振幅级别。使用16位的二进制来表示一个采样点,可以使用0~65535来表示一个振幅级别。
如下图所示这是一个连续的模拟信号(仅作演示使用,实际上的音频文件比此图要复杂得多):

对上图进行声音信号的采样后为:

如何比较振幅的大小呢?如下图中,在水平方向上,每一个线段表示一个频段,从左到右的的频率是逐渐增大的。(从图中不能直接观察到);而在竖直方向上,线段的高度越高,那么表示振幅(即表示响度)越大。这是某个时刻的频谱图,将所有时刻的声音连接到一起就成为一个完整的音频文件。
