移动端音视频入门

最新推荐文章于 2023-02-15 20:58:55 发布

原创最新推荐文章于 2023-02-15 20:58:55 发布 · 1.3k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#移动音视频开发

移动音视频开发专栏收录该内容

1 篇文章

订阅专栏

本文介绍了音视频直播的泛娱乐化和实时互动两种架构，阐述了CDN网络构成。讲解了声音三要素、音频量化、压缩及编码过程，介绍常见音频编码器。还介绍了H264基本概念、压缩技术、编码分层等，提及YUV格式。最后说明了音视频知识及行业痛点。

###音视频直播分成两种架构:

泛娱乐化直播架构
实时互动直播架构

###泛娱乐化直播架构:
泛娱乐直播架构
主播端发送信令到信令服务器，申请创建房间，信令服务器创建房间后返回一个流媒体地址给主播，主播将采集的音视频数据形成rtmp流，推送到CDN流媒体云。客户端也要发送信令到信令服务器申请加入房间，信令服务器接收到信令后，将该客户加入主播房间并返回一个流媒体地址给客户端，然后客户通过接收到的流媒体地址从CDN拉取相应的主播的音视频。

###CDN网络介绍

为了解决用户访问网络资源慢问题。

###CDN构成

边缘节点:用户从边缘节点上获取数据。
二级节点:主干节点，主要用于缓存，减轻源站压力。
源站:CP(内容提供方)将内容放到源站。

用户开始从边缘节点获取数据，如果有就直接返回给用户，如果没有就在去从主干节点获取，主干节点如果有，先将数据返给边缘节点，边缘节点缓存数据，然后主干节点将数据返回给用户，主干节点如果没有就从源站获取，实现思路与主干节点一样。

###声音三要素:

音调:就是音频，男生->女生->儿童->
音量:振动的幅度。
音色:它与材质有很大关系，本质是谐波。

###音频量化过程:

音频量化过程
###量化基本概念:

采样大小:一个采样用多少bit存放。常用的是16bit；
采样率:采样率8K、16K、32K、44.1K、48K。
声道数:单声道、双声道、多声道。

###码率计算:
采样率采样大小声道数

###音频压缩技术:

消除冗余数据

1.压缩的主要方法是去除采集到的音频冗余信息，所谓冗余信息包括人耳听觉范围外的音频信号以及被掩蔽掉的音频信号。

2.信号的掩蔽可以分为频域掩蔽和时域掩蔽。

哈夫曼无损编码: 用短码代替长码，实现压缩效果。

###音频的编码过程:

###常见的音频编码器:

常见的音频编码器包括OPUS、AAC、Vorbis、Speex、iLBC、AMR、G.711等。
网上测评结果:OPUS>AAC>Vorbis

###AAC介绍:

AAC(Advanced Audio Coding)目的是取代MP3格式。
MPEG-4标准出现后，AAC加入了SBR技术和PS技术。
目前常用的规格有AAC LC、AAC HE V1、AAC HE V2。

###AAC规格:

###AAC规格描述:

AAC LC:(Low Complexity)低复杂度，码流128k；
AAC HE:AAC LC + SBR(Spectral Band Replication)
AAC HE V2:AAC LC + SBR + PS(parametric Stereo)

###AAC格式:

ADIF(Audio Data Interchange Format)：这个格式只能从头开始解码，常用在磁盘文件中。
ADTS(Audio Data Transport Stream)这种格式每一帧都有一个同步字，可以在音频流任何位置开始解码，它似于数据格式。

###AAC编码库优先级:
Libfdk_AAC > ffmpeg AAC > libfaac > libvo_aacenc

###H264基本概念:

I帧:关键帧，采用帧内压缩技术。
P帧:向前参考帧，压缩时只参考前一个帧，属于帧间压缩技术。
B帧:双向参考帧，压缩时既参考前一帧也参考后一帧，帧间压缩技术。

###SPS与PPS:

SPS(Sequence Parameter Set):序列参数集，存放帧数、参考帧数目、解码图像尺寸、帧场编码模式选择标识等。
PPS(Picture Parameter Set):图像参数集，存放熵编码模式选择标识、片组数目、初始量化参数和去方块滤波系数调整标识等。

###视频花屏/卡顿原因:

如果GOP分组中的P帧丢失会造成解码端的图像发生错误。
为了避免花屏问题的发生，一般如果发现P帧或者I帧丢失，就不显示本GOP内的所有帧，直到下一个I帧来后重新刷新图像。

###视频编码器:

x264/x265(使用软编码)：x265的压缩比更好，导致占cpu更高，所以在直播应用中还是不是很适用，如果在点播中可以尝试使用。
openH264(软编码):性能低于x系列，但是支持svc视频技术。svc技术是值将一帧数据分为小中大三层，网络差时，只发送小的一层(内核的帧)，网络好时，将中层也发出去，网络非常好时，将一帧数据都发送出去，三层叠加，就形成了一帧视频。svc在移动端，很多硬件不支持，所以只能使用软编码，这样会导致很耗CPU和电池。
vp8/vp9：相对应的x系列。

###H264压缩技术