【数字音频】WAV和PCM的关系和区别

本文深入解析了WAV和PCM两种音频格式的本质区别。WAV是一种无损音频文件格式,支持包括PCM在内的多种编码方式。PCM(脉码调制)则是无压缩的音频编码方式,直接记录声音的数字信号,具有高保真度。WAV与PCM的关系及其在音频处理中的应用也被详细阐述。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作者:张明云
链接:https://www.jianshu.com/p/1d1f893e53e9
來源:简书

什么是WAV和PCM?

WAV:wav是一种无损的音频文件格式,WAV符合 PIFF(Resource Interchange File Format)规范。所有的WAV都有一个文件头,这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。
PCM:PCM(Pulse Code Modulation----脉码调制录音)。所谓PCM录音就是将声音等模拟信号变成符号化的脉冲列,再予以记录。PCM信号是由[1]、[0]等符号构成的数字信号,而未经过任何编码和压缩处理。与模拟信号比,它不易受传送系统的杂波及失真的影响。动态范围宽,可得到音质相当好的影响效果。
简单来说:wav是一种无损的音频文件格式,pcm是没有压缩的编码方式。

WAV和PCM的关系

WAV可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了。在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。
简单来说:pcm是无损wav文件中音频数据的一种编码方式,但wav还可以用其它方式编码。

将录音写成wav格式的文件

有时候需要将录音文件保存为wav格式,这需要手动填充wav的文件头信息,整段代码非常简单,大致如下:

private RandomAccessFile fopen(String path) throws IOException {
    File f = new File(path);

    if (f.exists()) {
        f.delete();
    } else {
        File parentDir = f.getParentFile();
        if (!parentDir.exists()) {
            parentDir.mkdirs();
        }
    }

    RandomAccessFile file = new RandomAccessFile(f, "rw");
    // 16K、16bit、单声道
    /* RIFF header */
    file.writeBytes("RIFF"); // riff id
    file.writeInt(0); // riff chunk size *PLACEHOLDER*
    file.writeBytes("WAVE"); // wave type

    /* fmt chunk */
    file.writeBytes("fmt "); // fmt id
    file.writeInt(Integer.reverseBytes(16)); // fmt chunk size
    file.writeShort(Short.reverseBytes((short) 1)); // format: 1(PCM)
    file.writeShort(Short.reverseBytes((short) 1)); // channels: 1
    file.writeInt(Integer.reverseBytes(16000)); // samples per second
    file.writeInt(Integer.reverseBytes((int) (1 * 16000 * 16 / 8))); // BPSecond
    file.writeShort(Short.reverseBytes((short) (1 * 16 / 8))); // BPSample
    file.writeShort(Short.reverseBytes((short) (1 * 16))); // bPSample

    /* data chunk */
    file.writeBytes("data"); // data id
    file.writeInt(0); // data chunk size *PLACEHOLDER*

    Log.d(TAG, "wav path: " + path);
    return file;
}

private void fwrite(RandomAccessFile file, byte[] data, int offset, int size) throws IOException {
    file.write(data, offset, size);
    Log.d(TAG, "fwrite: " + size);
}

private void fclose(RandomAccessFile file) throws IOException {
    try {
        file.seek(4); // riff chunk size
        file.writeInt(Integer.reverseBytes((int) (file.length() - 8)));

        file.seek(40); // data chunk size
        file.writeInt(Integer.reverseBytes((int) (file.length() - 44)));

        Log.d(TAG, "wav size: " + file.length());

    } finally {
        file.close();
    }
}

转载补充

在此文章之外还搜索了相关资料,这里予以补充。

wav就是pcm+文件头,pcm就是采集的麦克风的adc值

PCM基本工作原理

脉冲调制就是把一个时间连续,取值连续的模拟信号变换成时间离散,取值离散的数字信号后在信道中传输。脉冲编码调制就是对模拟信号先抽样,再对样值幅度量化,编码的过程。
所谓抽样,就是对模拟信号进行周期性扫描,把时间上连续的信号变成时间上离散的信号。该模拟信号经过抽样后还应当包含原信号中所有信息,也就是说能无失真的恢复原模拟信号。它的抽样速率的下限是由抽样定理确定的。在该实验中,抽样速率采用8Kbit/s。
所谓量化,就是把经过抽样得到的瞬时值将其幅度离散,即用一组规定的电平,把瞬时抽样值用最接近的电平值来表示。
一个模拟信号经过抽样量化后,得到已量化的脉冲幅度调制信号,它仅为有限个数值。
所谓编码,就是用一组二进制码组来表示每一个有固定电平的量化值。然而,实际上量化是在编码过程中同时完成的,故编码过程也称为模/数变换,可记作A/D。
PCM话音信号先经防混叠低通滤波器,进行脉冲抽样,变成8KHz重复频率的抽样信号(即离散的脉冲调幅PAM信号),然后将幅度连续的PAM信号用"四舍五入"办法量化为有限个幅度取值的信号,再经编码后转换成二进制码。对于电话,CCITT规定抽样率为8KHz,每抽样值编8位码,即共有28=256个量化值,因而每话路PCM编码后的标准数码率是64kb/s。为解决均匀量化时小信号量化误差大,音质差的问题,在实际中采用不均匀选取量化间隔的非线性量化方法,即量化特性在小信号时分层密,量化间隔小,而在大信号时分层疏,量化间隔大。

<think>好的,我需要回答用户关于PCM音频WAV音频区别的问题。首先,我应该回顾一下用户提供的引用资料,确保准确理解两者的定义结构。 根据引用[1],WAV文件是存储PCM音频的流行格式,几乎等同于原始数字音频。而引用[3]提到WAV是基于RIFF格式的子集,包含多个块结构。PCM则是未经压缩的原始音频数据,而WAV作为容器格式,可能包含PCM数据或其他编码格式,但最常见的是PCM。需要明确两者的核心差异:PCM是编码方式,WAV是文件格式,包含头信息元数据。此外,WAV支持多种参数,如比特率、采样率等,而PCM本身只是数据的表示形式。用户可能需要知道它们在应用中的不同,比如WAV更适合存储传输,而PCM常用于实时处理。还要注意WAV的可选块,如Fact或Cue points,这些是PCM所不具备的。最后,结合引用[2]的转换示例,说明两者转换的可行性及过程。需要确保回答结构清晰,分点阐述,并自然引用提供的资料。</think>### PCM音频与WAV音频的区别详解 #### 1. **定义与本质区别** - **PCM音频**(脉冲编码调制):是未经压缩的原始数字音频数据格式,直接记录声音的采样值,包含**采样率、位深、声道数**等参数,但无文件头信息。例如,一段16位、44.1kHz的立体声PCM数据仅由连续的二进制采样点构成[^1]。 - **WAV音频**:是基于RIFF容器格式的文件标准,在PCM数据的基础上添加了文件头(包含格式描述、元数据等)。其本质是“带包装的PCM”,支持存储多种编码格式,但默认以PCM编码为主[^3]。 #### 2. **文件结构差异** - **PCM文件**:仅包含原始音频二进制流,无任何附加信息。例如: ```plaintext [采样1][采样2][采样3]... ``` - **WAV文件**:由多个区块(Chunk)组成: - **RIFF WAVE Chunk**:标识文件类型。 - **Format Chunk**:存储音频参数(如PCM格式、声道数、采样率)。 - **Data Chunk**:存放实际的PCM数据。 - 其他可选区块(如Fact Chunk、Cue点标记)[^3]。 #### 3. **功能与应用场景** - **PCM**:多用于**实时音频传输或处理**(如电话系统、音频编解码中间数据),因无头文件,需提前约定参数。 - **WAV**:适用于**长期存储或跨平台交换**(如音乐制作、多媒体应用),因其头文件能自描述参数,兼容性强。 #### 4. **转换关系** - **PCMWAV**:需添加WAV文件头,指定采样率、位深等信息。例如引用[2]的代码通过补全头信息实现转换。 - **WAVPCM**:只需提取Data Chunk中的二进制数据,去除头文件。 #### 5. **扩展特性** - WAV支持**非PCM编码**(如ADPCM压缩格式),但较少使用。 - PCM数据若未封装为WAV,无法直接被多数播放器识别,需依赖外部参数解析。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值