读取PCM文件发送
1. 什么是PCM?
PCM(Pulse Code Modulation,脉冲编码调制)音频数据是未经压缩的音频采样数据裸流,它是由模拟信号经过采样、量化、编码转换成的标准数字音频数据。
描述PCM数据的6个参数:
- Sample Rate : 采样频率。8kHz(电话)、44.1kHz(CD)、48kHz(DVD)。
- Sample Size : 量化位数。通常该值为16-bit。
- Number of Channels : 通道个数。常见的音频有立体声(stereo)和单声道(mono)两种类型,立体声包含左声道和右声道。另外还有环绕立体声等其它不太常用的类型。
- Sign : 表示样本数据是否是有符号位,比如用一字节表示的样本数据,有符号的话表示范围为-128 ~ 127,无符号是0 ~ 255。
- Byte Ordering : 字节序。字节序是little-endian还是big-endian。通常均为little-endian。字节序说明见第4节。
- Integer Or Floating Point : 整形或浮点型。大多数格式的PCM样本数据使用整形表示,而在一些对精度要求高的应用方面,使用浮点类型表示PCM样本数据。
pcm是音频的编码格式,不是文件的封装格式;aac既是编码格式也是封装格式,一般aac封装格式的内部音频数据编码格式也为aac。
pcm文件所占容量的公式:
存储量 = (采样频率 * 采样位数 * 声道) * 时间 / 8 (单位: 字节数)
故可以根据文件大小来计算时间。

本文介绍了PCM音频数据的基本概念,包括采样率、量化位数、通道数等,并详细讲解了FFmpeg数据结构,重点阐述了音频数据编码所需参数如采样率、通道布局。此外,展示了如何使用fread函数读取PCM文件,以及一个实际示例。
最低0.47元/天 解锁文章
860

被折叠的 条评论
为什么被折叠?



