音频帧大小

原创已于 2022-07-06 20:11:26 修改 · 5.8k 阅读

·

11

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2022-05-14 15:43:02 首次发布

音视频专栏收录该内容

6 篇文章

订阅专栏

本文详细解析了PCM音频帧的内存大小计算，包括采样率、采样大小和声道数的影响。同时，区分了采样间隔与发送间隔两个概念，指出发送间隔（如20ms或10ms）对实时性和数据量的影响，并举例说明如何根据码率和发送间隔计算一帧PCM音频的数据大小。此外，提到了与sip中ptime的相似性，有助于理解音频数据传输中的帧处理。

本文主要说明如何计算一帧PCM音频帧的内存大小，

区分采样间隔和发送间隔的概念，

我发现很多文章中都没有把这两个概念区分清楚。

采集部分，从音频基本概念将其其中的采样间隔理解为采样率，即每秒采集多少次。这是大多数人所熟知的。

------------------------------------------------采集部分------------------------------------------------

PCM作为音频的原始数据格式，将声音进行量化时有以下几个概念：

采样率，采样大小（位深），声道数。

采样率：比如16kHz表示采集时每秒采集16k次，此时就会有16k个采样点；

采样大小：如16bit表示每个采样点存储在16bit内存中，即需要2个字节在保存；

声道很好理解：比如双声道是为了人耳听左右耳声音不同，比较有立体效果；但从音频数据存储的角度来说就要保存双份的采样音频数据。

PCM音频流的码率：采样率x采样大小x声道数。

如16k x 16 x 2=512kb/s，即每秒的音频原始数据需要占512kbit。

可以理解为音频采样时，按每秒16k次的频率进行采样，16bit即每个采样点存2个字节，每次存2份（声道），这1s的音频数据需要用的512kbit空间来存放，也就是512kbit/8=64k字节。

------------------------------------------------发送部分------------------------------------------------

我们假设不进行编码，直接原始音频数据进行传输，每秒64k字节的数据，采集一秒发送一次，也不是不行，不过实时性不够，量也太大。

所以正常会有个发送间隔的概念，比如20ms发送一次数据，说明每秒钟需发送50次(1s=1000ms)；有些文章会将这个间隔时间叫做采样间隔，我感觉会经常和采样率混在一起，不好理解。所以我觉得叫发送间隔会更好。这个与sip中协商的发送媒体打包时长ptime的概念很类似，跟他进行对比理解比较好理解。

这边发送的每次数据就是一帧PCM音频帧，按码率为64k字节来算，一帧PCM音频为：64k/50=1280字节；也就是此时你为每帧PCM需要开辟1280字节内存来存放。

如果是正常16k采样率，16bit采样大小，单声道，即32k字节的每秒的码率的音频数据，以20ms的发送间隔，一帧PCM数据 = 32k / 50 = 640字节。

如果按10ms的发送间隔，此时每帧PCM的大小即为320字节。

比如我在做的AC的DSP芯片的PCM音频包默认就是16k采样率，16bit采样大小，单声道的数据，发送出来的间隔为10ms，我们编码时为其开辟的buffer为320字节。

评论 3

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。