【音视频基础】音频基础理论

本文介绍了音频的基础理论,包括声音的产生、人类听觉范围和声音的三要素。接着讲解了模数转换和PCM裸流,重点讨论了采样大小、采样率和声道数的概念,以及如何计算PCM音频流的码率。同时,提到了使用Adobe Audition和ffplay工具来查看和播放PCM音频文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

个人简介

📦个人主页:一二三o-0-O的博客
🏆技术方向:C/C++客户端(直播+音视频剪辑)
📣专栏目标:务实的掌握音视频相关专业知识
🧡如果对您有帮助的话辛苦点赞支持。👍👍👍

音视频基础专栏系列

(一)【音视频基础】音频基础理论
(二)【音视频基础】视频基础理论
(三)【音视频基础】封装格式与编码数据

ffmpeg专栏系列

(一)【ffmpeg】ffmpeg命令工具的使用
(二)【ffmpeg】视频解码器
(三)【ffmpeg】SDL视频显示
(四)【ffmpeg】ffmpeg+SDL实现播放器

声音是如何被听到的

声音的产生

  1. 声音是由物体振动产生的
  2. 它可以通过空气、固体、液体等进行传输
  3. 震动耳膜
  4. 经过大脑神经识别

人类听觉范围

在这里插入图片描述
如上图所示:人类的听觉范围是20Hz~20kHz

声音的三要素

  1. 音调:音频的快慢
    在这里插入图片描述
    由上图的波形图可知:红线绿线代表的音频的频率大于红线代表的音频的频率,因此绿线代表的音频的音调大于红线代表的音频的音调
  2. 音量:震动的幅度
    在这里插入图片描述
    由上图的波形图可知:红线右侧的音量震动的幅度大于红线左侧的音量震动幅度,因此右侧的音量高于左侧的音量
  3. 音色:谐波
    在这里插入图片描述
    不同的音色由不同的谐波组成的:(绿色为基频主频)基频+一次谐波(黄)+二次谐波(蓝)

模数转换

将音频模拟信号转化为数字信号的流程图如下:
在这里插入图片描述

PCM裸流

关键采样概念

现在已经将模拟信号转化为了数字信号。在对声音进行量化的过程有一些关键采样概念

  1. 采样大小:一个采样用多少bit存放。常用的是16bit
  2. 采样率:采样频率8k、16k、32k、44.1k、48k
  3. 声道数:单声道、双声道、多声道

音频采样数据

作用与特点

音频采样数据的作用是:保存了音频中每个采样点的值。 数据特点是体积会很大,一般情况加一首4分钟的PCM格式的歌曲体积为:4604410022 = 42.3MByte(假定采样率为44.1KHz,采样大小为16bit,双声道)。

码率

那么如何计算一个PCM音频流的码率呢?
同理:采样率为44.1KHz,采样大小为16bit,双声道采集的PCM裸流的码率是:44100 * 2 * 2 = 176400Byte/s = 176.4KB/s = 1411.2Kb/s

PCM格式存储

PCM格式的存储方式是单声道的情况下按照顺序存储每个采样点的数据。 双声道的情况下按照“左右、左右”的顺序存储每个采样点两个声道的数据。

在这里插入图片描述

音频采样数据查看工具:Adobe Audition

在这里插入图片描述
如图所示:你可以导入一个PCM音频裸流文件,输入PCM的采样大小、采样率与声道数就可以直接播放PCM音频文件。可以看到音频的波形图、播放电平等关键信息。

ffplay播放PCM

最后大家可以尝试使用ffplay直接播放PCM音频文件。
ffplay命令:ffplay -ar 44100 -ac 2 -f s16le -i 00NocturneNo2inEflat_44.1k_s16le.pcm

  • -ar:采样率
  • -ac:声道数
  • -f:采样大小
  • -i:PCM音频文件

播放效果如下图:
在这里插入图片描述

参考资料

【1】雷神博客
【2】李超:音视频基础+ffmpeg原理

评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一二三o-0-O

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值