视音频学习基础篇(一)----YUV采样格式和存储格式

先给自己打个广告,本人的微信公众号:嵌入式Linux江湖,主要关注嵌入式软件开发,股票基金定投,足球等等,希望大家多多关注,有问题可以直接留言给我,一定尽心尽力回答大家的问题。
在这里插入图片描述
本系列主要介绍视频中的基础知识,我们都知道视音频方向主要处理视频和音频,视频是由连续的图像组成的,而图像的基本单元是像素,像素可以是RGB格式的,也可以是YUV格式的。

自然世界中的景色经过光学sensor之后,就会变成RGB格式的像素,一般地,在计算机处理领域会首先将RGB格式的像素,转换成YUV格式的像。RGB像素和YUV像素都是对颜色的一种编码。

本文主要就先介绍YUV像素的采样和格式。

一 what

(1)什么是YUV

YUV是一种颜色编码方式,在平时工作和学习中,还会遇到很多类似的词,包括YCbCr,YPbPr等等,这几个词代表的意思都比较接近,这是YUV定义的wiki百科:https://zh.wikipedia.org/wiki/YUV
Y:代表明亮度,Luma;UV:代表色度,Chroma。

(2)YUV采样格式

YUV 图像的主流采样方式有如下三种:

  • YUV 4:4:4 采样
    YUV 4:4:4 表示 Y、U、V 三分量采样率相同,即每个像素的三分量信息完整。假设每个分量都是 8bit,则每个像素占用 3 个字节,如下图所示。
    其中,Y 分量用叉表示,UV 分量用圆圈表示。
    在这里插入图片描述
四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
采样的码流为: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3
映射出的像素点为:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
  • YUV 4:2:2 采样
    YUV 4:2:2 采样,意味着 UV 分量是 Y 分量采样的一半,Y 分量和 UV 分量按照 2 : 1 的比例采样。如果水平方向有 10 个像素点,那么采样了 10 个 Y 分量,而只采样了 5 个 UV 分量。
    其中,Y 分量用叉表示,UV 分量用圆圈表示。
    在这里插入图片描述
 假如图像像素为:[Y0 U0 V0][Y1 U1 V1][Y2 U2 V2][Y3 U3 V3]
 那么采样的码流为:Y0 U0 Y1 V1 Y2 U2 Y3 V3 
 其中,每采样过一个像素点,都会采样其 Y 分量,而 U、V 分量就会间隔一个采集一个。
 最后映射出的像素点为 [Y0 U0 V1][Y1 U0 V1][Y2 U2 V3][Y3 U2 V3]

采样的码流映射为像素点,还是要满足每个像素点有 Y、U、V 三个分量。但是可以看到,第一和第二像素点公用了 U0、V1 分量,第三和第四个像素点公用了 U2、V3 分量,这样就节省了图像空间。
一张 1280 * 720 大小的图片(每个分量都是8bit的话),在 YUV 4:2:2 采样时的大小为:

1280 * 720 + 1280 * 720 * 0.5 * 2/ 1024 / 1024 = 1.76 MB

可以看到 YUV 4:2:2 采样的图像比 RGB 模型图像节省了三分之一的存储空间,在传输时占用的带宽也会随之减少。

  • YUV 4:2:0 采样
    YUV 4:2:0 采样,并不是指只采样 U 分量而不采样 V 分量。而是指,在每一行扫描时,只扫描一种色度分量(U 或者 V),和 Y 分量按照 2 : 1 的方式采样。
    比如,第一行扫描时,YU 按照 2 : 1 的方式采样,那么第二行扫描时,YV 分量按照 2:1 的方式采样。对于每个色度分量来说,它的水平方向和竖直方向的采样和 Y 分量相比都是 2:1 。
    其中,Y 分量用叉表示,UV 分量用圆圈表示。
    在这里插入图片描述
    假设第一行扫描了 U 分量,第二行扫描了 V 分量,那么需要扫描两行才能够组成完整的 UV 分量。
假设图像像素为:
 
[Y0 U0 V0][Y1 U1 V1][Y2 U2 V2][Y3 U3 V3]
[Y5 U5 V5][Y6 U6 V6][Y7 U7 V7][Y8 U8 V8]
那么采样的码流为:Y0 U0 Y1 Y2 U2 Y3 Y5 V5 Y6 Y7 V7 Y8
其中,每采样过一个像素点,都会采样其 Y 分量,而 U、V 分量就会间隔一行按照 2 : 1 进行采样。
最后映射出的像素点为:
[Y0 U0 V5][Y1 U0 V5][Y2 U2 V7][Y3 U2 V7]
[Y5 U0 V5][Y6 U0 V5][Y7 U2 V7][Y8 U2 V7]

从映射出的像素点中可以看到,四个 Y 分量是共用了一套 UV 分量,而且是按照 2*2 的小方格的形式分布的,相比 YUV 4:2:2 采样中两个 Y 分量共用一套 UV 分量,这样更能够节省空间。
一张 1280 * 720 大小的图片(每个分量都是8bit的话),在 YUV 4:2:0 采样时的大小为:

1280 * 720 + 1280 * 720 * 0.25 * 2/ 8 / 1024 / 1024 = 1.32 MB

可以看到 YUV 4:2:0 采样的图像比 RGB 模型图像节省了一半的存储空间,因此它也是比较主流的采样方式。

(3)YUV存储格式

说完了采样,接下来就是如何把采样的数据存储起来。

  • planar 平面格式
    指先连续存储所有像素点的 Y 分量,然后存储 U 分量,最后是 V 分量。
  • packed 打包模式
    指每个像素点的 Y、U、V 分量是连续交替存储的。

(4)YUV格式

根据采样方式和存储格式的不同,就有了多种 YUV 格式。这些格式主要是基于 YUV 4:2:2 和 YUV 4:2:0 采样。
常见的基于 YUV 4:2:2 采样的格式如下表:
在这里插入图片描述
常见的基于 YUV 4:2:0 采样的格式如下表:
在这里插入图片描述
(a)基于 YUV 4:2:2 采样的格式
YUV 4:2:2 采样规定了 Y 和 UV 分量按照 2: 1 的比例采样,两个 Y 分量公用一组 UV 分量。
- YUYV 格式
YUYV 格式是采用打包格式进行存储的,指每个像素点都采用 Y 分量,但是每隔一个像素采样它的 UV 分量,排列顺序如下:

Y0 UO Y1 V0 Y2 U2 Y3 V2

Y0 和 Y1 公用 U0 V0 分量,Y2 和 Y3 公用 U2 V2 分量….
在这里插入图片描述
- UYVY 格式
UYVY 格式也是采用打包格式进行存储,它的顺序和 YUYV 相反,先采用 U 分量再采样 Y 分量,排列顺序如下:

U0 Y0 V0 Y1 U2 Y2 V2 Y3

Y0 和 Y1 公用 U0 V0 分量,Y2 和 Y3 公用 U2 V2 分量….
在这里插入图片描述
- YUV 422P 格式
YUV 422P 格式,又叫做 I422,采用的是平面格式进行存储,先存储所有的 Y 分量,再存储所有的 U 分量,再存储所有的 V 分量。

(b)基于 YUV 4:2:0 采样的格式

基于 YUV 4:2:0 采样的格式主要有 YUV 420P 和 YUV 420SP 两种类型,每个类型又对应其他具体格式。
- YUV 420P 类型
(1)YU12 格式
(2)YV12 格式
- YUV 420SP 类型
(1)NV12 格式
(2)NV21 格式
YUV 420P 和 YUV 420SP 都是基于 Planar 平面模式 进行存储的,先存储所有的 Y 分量后, YUV420P 类型就会先存储所有的 U 分量或者 V 分量,而 YUV420SP 则是按照 UV 或者 VU 的交替顺序进行存储了,具体查看看下图:
YUV420SP 的格式:
在这里插入图片描述
YUV420P 的格式:
在这里插入图片描述
- YU12 和 YV12 格式
YU12 和 YV12 格式都属于 YUV 420P 类型,即先存储 Y 分量,再存储 U、V 分量,区别在于:YU12 是先 Y 再 U 后 V,而 YV12 是先 Y 再 V 后 U 。
YV 12 的存储格式如下图所示:
在这里插入图片描述
YU 12 又称作 I420 格式,它的存储格式就是把 V 和 U 反过来了。
- NV12 和 NV21 格式
NV12 和 NV21 格式都属于 YUV420SP 类型。它也是先存储了 Y 分量,但接下来并不是再存储所有的 U 或者 V 分量,而是把 UV 分量交替连续存储。
NV12 是 IOS 中有的模式,它的存储顺序是先存 Y 分量,再 UV 进行交替存储。
在这里插入图片描述
NV21 是 安卓 中有的模式,它的存储顺序是先存 Y 分量,在 VU 交替存储。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值