图文详解YUV420数据格式

最新推荐文章于 2020-12-30 05:01:05 发布

转载最新推荐文章于 2020-12-30 05:01:05 发布 · 384 阅读

文章标签：

#yuv

multimedia 专栏收录该内容

2 篇文章

订阅专栏

本文深入解析YUV格式的两大类：planar和平面packed。详细介绍YUV格式在不同采样方式（YUV4:4:4，YUV4:2:2，YUV4:2:0）下的存储方式，并对比了多种YUV格式如YUVY、UYVY、YUV422P、YV12、NV12等之间的区别。

转自 http://www.cnblogs.com/azraelly/archive/2013/01/01/2841269.html

YUV 格式有两大类：planar 和 packed。

对于 planar 的 YUV 格式，先连续存储所有像素点的 Y，紧接着存储所有像素点的 U，随后是所有像素点的 V。
对于 packed 的 YUV 格式，每个像素点的 Y, U, V 是连续交错存储的。

YUV，分为三个分量，“Y” 表示明亮度（Luminance 或 Luma），也就是 灰度值；而 “U” 和 “V” 表示的则是色度（Chrominance 或 Chroma），作用是描述影像色彩及饱和度，用于指定像素的颜色。

与我们熟知的 RGB 类似，YUV 也是一种颜色编码方法，主要用于电视系统以及模拟视频领域，它将亮度信息（Y）与色彩信息（UV）分离，没有 UV 信息一样可以显示完整的图像，只不过是黑白的，这样的设计很好地解决了彩色电视机与黑白电视的兼容问题。并且，YUV 不像 RGB 那样要求三个独立的视频信号同时传输，所以 用 YUV 方式传送占用极少的频宽。

1. 采样

YUV 码流的存储格式其实与其采样的方式密切相关，主流的采样方式有三种，YUV4:4:4，YUV4:2:2，YUV4:2:0，关于其详细原理，可以通过网上其它文章了解，这里我想强调的是如何根据其采样格式来从码流中还原每个像素点的 YUV 值，因为只有正确地还原了每个像素点的 YUV 值，才能通过 YUV 与 RGB 的转换公式提取出每个像素点的 RGB 值，然后显示出来。

用三个图来直观地表示采集的方式吧，以黑点表示采样该像素点的 Y 分量，以空心圆圈表示采用该像素点的 UV 分量

YUV采样

先记住下面这段话，以后提取每个像素的YUV分量会用到。

YUV 4:4:4采样，每一个Y对应一组UV分量。
YUV 4:2:2采样，每两个Y共用一组UV分量。
YUV 4:2:0采样，每四个Y共用一组UV分量。

2. 存储方式

下面我用图的形式给出常见的 YUV 码流的存储方式，并在存储方式后面附有取样每个像素点的 YUV 数据的方法，其中，Cb、Cr 的含义等同于 U、V。

（1） YUVY 格式（属于YUV422）

YUYV为YUV422采样的存储格式中的一种，相邻的两个Y共用其相邻的两个Cb、Cr，分析，对于像素点Y’00、Y’01 而言，其Cb、Cr的值均为 Cb00、Cr00，其他的像素点的YUV取值依次类推。

（2） UYVY 格式（属于YUV422）

UYVY格式也是YUV422采样的存储格式中的一种，只不过与YUYV不同的是UV的排列顺序不一样而已，还原其每个像素点的YUV值的方法与上面一样。

（3） YUV422P（属于YUV422）
YUV422P

YUV422P也属于YUV422的一种，它是一种Plane模式，即平面模式，并不是将YUV数据交错存储，而是先存放所有的Y分量，然后存储所有的U（Cb）分量，最后存储所有的V（Cr）分量，如上图所示。其每一个像素点的YUV值提取方法也是遵循YUV422格式的最基本提取方法，即两个Y共用一个UV。比如，对于像素点Y’00、Y’01 而言，其Cb、Cr的值均为 Cb00、Cr00。

（4）YV12，YU12格式（属于YUV420）
YV12

YU12和YV12属于YUV420格式，也是一种Plane模式，将Y、U、V分量分别打包，依次存储。其每一个像素点的YUV数据提取遵循YUV420格式的提取方式，即4个Y分量共用一组UV。注意，上图中，Y’00、Y’01、Y’10、Y’11共用Cr00、Cb00，其他依次类推。

（5）NV12、NV21（属于YUV420）
这里写图片描述

NV12和NV21属于YUV420格式，是一种two-plane模式，即Y和UV分为两个Plane，但是UV（CbCr）为交错存储，而不是分为三个plane。其提取方式与上一种类似，即Y’00、Y’01、Y’10、Y’11共用Cr00、Cb00

例子

YUV420 planar数据，以720×480大小图象YUV420 planar为例，

其存储格式是：共大小为(720×480×3>>1)字节，

分为三个部分:Y,U和V

Y分量： (720×480)个字节

U(Cb)分量：(720×480>>2)个字节

V(Cr)分量：(720×480>>2)个字节

三个部分内部均是行优先存储，三个部分之间是Y,U,V 顺序存储。

即YUV数据的0－－720×480字节是Y分量值，

720×480－－720×480×5/4字节是U分量

720×480×5/4 －－720×480×3/2字节是V分量。

4 ：2： 2 和4：2：0 转换:

最简单的方式：

YUV4:2:2 —> YUV4:2:0 Y不变，将U和V信号值在行(垂直方向)在进行一次隔行抽样。 YUV4:2:0 —> YUV4:2:2 Y不变，将U和V信号值的每一行分别拷贝一份形成连续两行数据。

在YUV420中，一个像素点对应一个Y，一个4X4的小方块对应一个U和V。对于所有YUV420图像，它们的Y值排列是完全相同的，因为只有Y的图像就是灰度图像。YUV420sp与YUV420p的数据格式它们的UV排列在原理上是完全不同的。420p它是先把U存放完后，再存放V，也就是说UV它们是连续的。而420sp它是UV、UV这样交替存放的。(见下图) 有了上面的理论，我就可以准确的计算出一个YUV420在内存中存放的大小。 width * hight =Y（总和） U = Y / 4 V = Y / 4

所以YUV420 数据在内存中的长度是 width * hight * 3 / 2(byte)，

假设一个分辨率为8X4的YUV图像，它们的格式如下图：

YUV420sp格式如下图:

YUV420p数据格式如下图:
YUV420p

旋转 90 度的算法:

public static void rotateYUV240SP(byte[] src, byte[] des, int width, int height)
{

  int wh = width * height;
  //旋转Y
  int k = 0;
  for(int i = 0; i < width; i++) {
   for(int j = 0; j < height; j++)
   {
      des[k] = src[width*j + i];  
      k++;
   }
  }

  for(int i = 0; i < width; i+ = 2) {
   for(int j = 0; j < height/2; j++)
   {
      des[k] = src[wh+ width*j + i];
      des[k+1]=src[wh + width*j + i+1];
      k+ = 2;
   }
  }

 }

YV12和I420(YU12)的区别

一般来说，直接采集到的视频数据是 RGB24 的格式，RGB24 一帧的大小 size＝width×heigth×3 Byte，RGB32 的 size＝width×heigth×4 byte，如果是 I420（即 YUV 标准格式 4：2：0）的数据量是 size＝width×heigth×1.5 Byte。

在采集到 RGB24 数据后，需要对这个格式的数据进行第一次压缩。即将图像的颜色空间由 RGB2YUV。因为，X264在进行编码的时候需要标准的 YUV（4：2：0）。但是这里需要注意的是，虽然 YV12 也是（4：2：0），但是 YV12 和 I420 的却是不同的，在存储空间上面有些区别。如下：

YV12 ：亮度（行×列）＋ V（行×列/4) + U（行×列/4）
I420 ：亮度（行×列）＋ U（行×列/4) + V（行×列/4）

可以看出，YV12 和 I420 基本上是一样的，就是 UV 的顺序不同。

继续我们的话题，经过第一次数据压缩后 RGB24－>YUV（I420）。这样，数据量将减少一半，为什么呢？呵呵，这个就太基础了，我就不多写了。同样，如果是 RGB24－>YUV（YV12），也是减少一半。但是，虽然都是一半，如果是 YV12 的话效果就有很大损失。然后，经过 X264 编码后，数据量将大大减少。将编码后的数据打包，通过 RTP 实时传送。到达目的地后，将数据取出，进行解码。完成解码后，数据仍然是 YUV 格式的，所以，还需要一次转换，这样 windows 的驱动才可以处理，就是 YUV2RGB24。

YUY2 是 4:2:2 [Y0 U0 Y1 V0]