【数字音频】WAV和PCM的关系和区别

最新推荐文章于 2024-11-14 09:09:01 发布

转载最新推荐文章于 2024-11-14 09:09:01 发布 · 6.6k 阅读

文章标签：

#wav #pcm #数字音频 #信号

数字音频专栏收录该内容

2 篇文章

订阅专栏

本文深入解析了WAV和PCM两种音频格式的本质区别。WAV是一种无损音频文件格式，支持包括PCM在内的多种编码方式。PCM（脉码调制）则是无压缩的音频编码方式，直接记录声音的数字信号，具有高保真度。WAV与PCM的关系及其在音频处理中的应用也被详细阐述。

作者：张明云
链接：https://www.jianshu.com/p/1d1f893e53e9
來源：简书

什么是WAV和PCM？

WAV：wav是一种无损的音频文件格式，WAV符合 PIFF(Resource Interchange File Format)规范。所有的WAV都有一个文件头，这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定，除了PCM之外，还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。
PCM:PCM（Pulse Code Modulation----脉码调制录音)。所谓PCM录音就是将声音等模拟信号变成符号化的脉冲列，再予以记录。PCM信号是由[1]、[0]等符号构成的数字信号，而未经过任何编码和压缩处理。与模拟信号比，它不易受传送系统的杂波及失真的影响。动态范围宽，可得到音质相当好的影响效果。
简单来说：wav是一种无损的音频文件格式，pcm是没有压缩的编码方式。

WAV和PCM的关系

WAV可以使用多种音频编码来压缩其音频流，不过我们常见的都是音频流被PCM编码处理的WAV，但这不表示WAV只能使用PCM编码，MP3编码同样也可以运用在WAV中，和AVI一样，只要安装好了相应的Decode，就可以欣赏这些WAV了。在Windows平台下，基于PCM编码的WAV是被支持得最好的音频格式，所有音频软件都能完美支持，由于本身可以达到较高的音质的要求，因此，WAV也是音乐编辑创作的首选格式，适合保存音乐素材。因此，基于PCM编码的WAV被作为了一种中介的格式，常常使用在其他编码的相互转换之中，例如MP3转换成WMA。
简单来说：pcm是无损wav文件中音频数据的一种编码方式，但wav还可以用其它方式编码。

将录音写成wav格式的文件

有时候需要将录音文件保存为wav格式，这需要手动填充wav的文件头信息，整段代码非常简单，大致如下：

private RandomAccessFile fopen(String path) throws IOException {
    File f = new File(path);

    if (f.exists()) {
        f.delete();
    } else {
        File parentDir = f.getParentFile();
        if (!parentDir.exists()) {
            parentDir.mkdirs();
        }
    }

    RandomAccessFile file = new RandomAccessFile(f, "rw");
    // 16K、16bit、单声道
    /* RIFF header */
    file.writeBytes("RIFF"); // riff id
    file.writeInt(0); // riff chunk size *PLACEHOLDER*
    file.writeBytes("WAVE"); // wave type

    /* fmt chunk */
    file.writeBytes("fmt "); // fmt id
    file.writeInt(Integer.reverseBytes(16)); // fmt chunk size
    file.writeShort(Short.reverseBytes((short) 1)); // format: 1(PCM)
    file.writeShort(Short.reverseBytes((short) 1)); // channels: 1
    file.writeInt(Integer.reverseBytes(16000)); // samples per second
    file.writeInt(Integer.reverseBytes((int) (1 * 16000 * 16 / 8))); // BPSecond
    file.writeShort(Short.reverseBytes((short) (1 * 16 / 8))); // BPSample
    file.writeShort(Short.reverseBytes((short) (1 * 16))); // bPSample

    /* data chunk */
    file.writeBytes("data"); // data id
    file.writeInt(0); // data chunk size *PLACEHOLDER*

    Log.d(TAG, "wav path: " + path);
    return file;
}

private void fwrite(RandomAccessFile file, byte[] data, int offset, int size) throws IOException {
    file.write(data, offset, size);
    Log.d(TAG, "fwrite: " + size);
}

private void fclose(RandomAccessFile file) throws IOException {
    try {
        file.seek(4); // riff chunk size
        file.writeInt(Integer.reverseBytes((int) (file.length() - 8)));

        file.seek(40); // data chunk size
        file.writeInt(Integer.reverseBytes((int) (file.length() - 44)));

        Log.d(TAG, "wav size: " + file.length());

    } finally {
        file.close();
    }
}

转载补充

在此文章之外还搜索了相关资料，这里予以补充。

wav就是pcm+文件头，pcm就是采集的麦克风的adc值

PCM基本工作原理

脉冲调制就是把一个时间连续，取值连续的模拟信号变换成时间离散，取值离散的数字信号后在信道中传输。脉冲编码调制就是对模拟信号先抽样，再对样值幅度量化，编码的过程。
所谓抽样，就是对模拟信号进行周期性扫描，把时间上连续的信号变成时间上离散的信号。该模拟信号经过抽样后还应当包含原信号中所有信息，也就是说能无失真的恢复原模拟信号。它的抽样速率的下限是由抽样定理确定的。在该实验中，抽样速率采用8Kbit/s。
所谓量化，就是把经过抽样得到的瞬时值将其幅度离散，即用一组规定的电平，把瞬时抽样值用最接近的电平值来表示。
一个模拟信号经过抽样量化后，得到已量化的脉冲幅度调制信号，它仅为有限个数值。
所谓编码，就是用一组二进制码组来表示每一个有固定电平的量化值。然而，实际上量化是在编码过程中同时完成的，故编码过程也称为模/数变换，可记作A/D。
PCM话音信号先经防混叠低通滤波器，进行脉冲抽样，变成8KHz重复频率的抽样信号(即离散的脉冲调幅PAM信号)，然后将幅度连续的PAM信号用"四舍五入"办法量化为有限个幅度取值的信号，再经编码后转换成二进制码。对于电话，CCITT规定抽样率为8KHz，每抽样值编8位码，即共有28=256个量化值，因而每话路PCM编码后的标准数码率是64kb/s。为解决均匀量化时小信号量化误差大，音质差的问题，在实际中采用不均匀选取量化间隔的非线性量化方法，即量化特性在小信号时分层密，量化间隔小，而在大信号时分层疏，量化间隔大。