嵌入式音视频开发——PCM编码与WAV音频文件格式详解

原创

已于 2025-08-01 14:56:25 修改 · 1.4k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#音视频 #笔记 #pcm

于 2025-07-28 11:34:24 首次发布

PCM 编码原理详解

一、PCM 基本概念

PCM（Pulse Code Modulation，脉冲编码调制）是一种将模拟信号数字化的无损编码方式，包含三个核心步骤：

采样（Sampling）
- 按照固定时间间隔（奈奎斯特频率）测量模拟信号的瞬时值
- 例如：CD音频采样率为44.1kHz（人耳最高识别20kHz的2倍以上）
- 公式：采样频率 ≥ 2 × 信号最高频率
量化（Quantization）
- 将连续幅值离散化为有限个量化电平
- 量化精度（位深）：常见16/24/32位
- 量化误差：实际值与量化值之差（引入"量化噪声"）
编码（Coding）
- 将量化值转换为二进制序列
- 线性PCM：直接二进制映射
- 编码公式：数字值 = (模拟值/满量程) × (2ⁿ-1)

二、关键技术特征

特性	说明
信号保真度	直接取决于采样率和量化位深
数据量	未压缩原始数据：位深×声道数×采样率
动态范围	每增加1比特提升约6dB信噪比
处理复杂度	编码/解码只需ADC/DAC转换，几乎无计算负载

Waveform 音频文件结构（WAV 格式）

PCM编码后的声音数据是需要保存的，WAVE文件常常用来保存PCM编码数据。WAVE文件是微软公司（Microsoft）开发的一种声音文件格式，用于保存Windows平台的音频信息资源，被Windows平台及其应用程序所广泛支持，WAVE文件默认打开工具是WINDOWS的媒体播放器。

1. RIFF文件格式标准

WAVE文件是以微软RIFF格式为标准的，RIFF全称为资源互换文件格式（Resources Interchange File Format），是Windows下大部分多媒体文件遵循的一种文件结构。RIFF文件所包含的数据类型由该文件的扩展名来标识，能以RIFF格式存储的数据有很多：音频视频交错格式数据（.AVI）、波形格式数据（.WAV）、位图数据格式（.RDI）、MIDI格式数据（.RMI）、调色板格式（.PAL）、多媒体电影（.RMN）、动画光标（.ANI）等。
　　如下代码所示的CK结构体是RIFF文件的基本单元，该基本单元也称 Chunk。其中ckID用于标识块中所包含的数据类型，其取值可有'RIFF'、'LIST'、'fmt '、'data'等；ckSize表示存储在ckData域中的数据长度（不包含ckID和ckSize的大小）；ckData存储数据，数据以字节为单位存放，如果数据长度为奇数，则最后添加一个空字节。

最低0.47元/天解锁文章