图文详解YUV420数据格式

本文深入解析YUV格式的两大类:planar和平面packed。详细介绍YUV格式在不同采样方式(YUV4:4:4,YUV4:2:2,YUV4:2:0)下的存储方式,并对比了多种YUV格式如YUVY、UYVY、YUV422P、YV12、NV12等之间的区别。

转自 http://www.cnblogs.com/azraelly/archive/2013/01/01/2841269.html

YUV 格式有两大类:planar 和 packed。

对于 planar 的 YUV 格式,先连续存储所有像素点的 Y,紧接着存储所有像素点的 U,随后是所有像素点的 V。
对于 packed 的 YUV 格式,每个像素点的 Y, U, V 是连续交错存储的。

YUV,分为三个分量,“Y” 表示明亮度(Luminance 或 Luma),也就是 灰度值;而 “U” 和 “V” 表示的则是色度(Chrominance 或 Chroma),作用是 描述影像色彩及饱和度,用于指定像素的颜色

与我们熟知的 RGB 类似,YUV 也是一种颜色编码方法,主要用于电视系统以及模拟视频领域,它将亮度信息(Y)与色彩信息(UV)分离,没有 UV 信息一样可以显示完整的图像,只不过是黑白的,这样的设计很好地解决了彩色电视机与黑白电视的兼容问题。并且,YUV 不像 RGB 那样要求三个独立的视频信号同时传输,所以 用 YUV 方式传送占用极少的频宽

1. 采样

YUV 码流的存储格式其实与其采样的方式密切相关,主流的采样方式有三种,YUV4:4:4,YUV4:2:2,YUV4:2:0,关于其详细原理,可以通过网上其它文章了解,这里我想强调的是 如何根据其采样格式来从码流中还原每个像素点的 YUV 值,因为只有正确地还原了每个像素点的 YUV 值,才能通过 YUV 与 RGB 的转换公式提取出每个像素点的 RGB 值,然后显示出来。

用三个图来直观地表示采集的方式吧,以黑点表示采样该像素点的 Y 分量,以空心圆圈表示采用该像素点的 UV 分量

YUV采样

先记住下面这段话,以后提取每个像素的YUV分量会用到。

  1. YUV 4:4:4采样,每一个Y对应一组UV分量。
  2. YUV 4:2:2采样,每两个Y共用一组UV分量。
  3. YUV 4:2:0采样,每四个Y共用一组UV分量。

2. 存储方式

下面我用图的形式给出常见的 YUV 码流的存储方式,并在存储方式后面附有取样每个像素点的 YUV 数据的方法,其中,Cb、Cr 的含义等同于 U、V。

(1) YUVY 格式 (属于YUV422)
YUVY 格式

YUYV为YUV422采样的存储格式中的一种,相邻的两个Y共用其相邻的两个Cb、Cr,分析,对于像素点Y’00、Y’01 而言,其Cb、Cr的值均为 Cb00、Cr00,其他的像素点的YUV取值依次类推。

(2) UYVY 格式 (属于YUV422)
UYVY 格式

UYVY格式也是YUV422采样的存储格式中的一种,只不过与YUYV不同的是UV的排列顺序不一样而已,还原其每个像素点的YUV值的方法与上面一样。

(3) YUV422P(属于YUV422)
YUV422P

YUV422P也属于YUV422的一种,它是一种Plane模式,即平面模式,并不是将YUV数据交错存储,而是先存放所有的Y分量,然后存储所有的U(Cb)分量,最后存储所有的V(Cr)分量,如上图所示。其每一个像素点的YUV值提取方法也是遵循YUV422格式的最基本提取方法,即两个Y共用一个UV。比如,对于像素点Y’00、Y’01 而言,其Cb、Cr的值均为 Cb00、Cr00。

(4)YV12,YU12格式(属于YUV420)
YV12

YU12和YV12属于YUV420格式,也是一种Plane模式,将Y、U、V分量分别打包,依次存储。其每一个像素点的YUV数据提取遵循YUV420格式的提取方式,即4个Y分量共用一组UV。注意,上图中,Y’00、Y’01、Y’10、Y’11共用Cr00、Cb00,其他依次类推。

(5)NV12、NV21(属于YUV420)
这里写图片描述

NV12和NV21属于YUV420格式,是一种two-plane模式,即Y和UV分为两个Plane,但是UV(CbCr)为交错存储,而不是分为三个plane。其提取方式与上一种类似,即Y’00、Y’01、Y’10、Y’11共用Cr00、Cb00

例子

YUV420 planar数据, 以720×480大小图象YUV420 planar为例,

其存储格式是: 共大小为(720×480×3>>1)字节,

分为三个部分:Y,U和V

Y分量: (720×480)个字节

U(Cb)分量:(720×480>>2)个字节

V(Cr)分量:(720×480>>2)个字节

三个部分内部均是行优先存储,三个部分之间是Y,U,V 顺序存储。

即YUV数据的0--720×480字节是Y分量值,

720×480--720×480×5/4字节是U分量

720×480×5/4 --720×480×3/2字节是V分量。

4 :2: 2 和4:2:0 转换:

最简单的方式:

YUV4:2:2 —> YUV4:2:0 Y不变,将U和V信号值在行(垂直方向)在进行一次隔行抽样。 YUV4:2:0 —> YUV4:2:2 Y不变,将U和V信号值的每一行分别拷贝一份形成连续两行数据。

在YUV420中,一个像素点对应一个Y,一个4X4的小方块对应一个U和V。对于所有YUV420图像,它们的Y值排列是完全相同的,因为只有Y的图像就是灰度图像。YUV420sp与YUV420p的数据格式它们的UV排列在原理上是完全不同的。420p它是先把U存放完后,再存放V,也就是说UV它们是连续的。而420sp它是UV、UV这样交替存放的。(见下图) 有了上面的理论,我就可以准确的计算出一个YUV420在内存中存放的大小。 width * hight =Y(总和) U = Y / 4 V = Y / 4

所以YUV420 数据在内存中的长度是 width * hight * 3 / 2(byte),

假设一个分辨率为8X4的YUV图像,它们的格式如下图:

YUV420sp格式如下图:
YUV420sp

YUV420p数据格式如下图:
 YUV420p

旋转 90 度的算法:

public static void rotateYUV240SP(byte[] src, byte[] des, int width, int height)
{

  int wh = width * height;
  //旋转Y
  int k = 0;
  for(int i = 0; i < width; i++) {
   for(int j = 0; j < height; j++)
   {
      des[k] = src[width*j + i];  
      k++;
   }
  }

  for(int i = 0; i < width; i+ = 2) {
   for(int j = 0; j < height/2; j++)
   {
      des[k] = src[wh+ width*j + i];
      des[k+1]=src[wh + width*j + i+1];
      k+ = 2;
   }
  }

 }

YV12和I420(YU12)的区别

一般来说,直接采集到的视频数据是 RGB24 的格式,RGB24 一帧的大小 size=width×heigth×3 Byte,RGB32 的 size=width×heigth×4 byte,如果是 I420(即 YUV 标准格式 4:2:0)的数据量是 size=width×heigth×1.5 Byte。

在采集到 RGB24 数据后,需要对这个格式的数据进行第一次压缩。即将图像的颜色空间由 RGB2YUV。因为,X264在进行编码的时候需要标准的 YUV(4:2:0)。但是这里需要注意的是,虽然 YV12 也是(4:2:0),但是 YV12 和 I420 的却是不同的,在存储空间上面有些区别。如下:

YV12 : 亮度(行×列) + V(行×列/4) + U(行×列/4)
I420 : 亮度(行×列) + U(行×列/4) + V(行×列/4)

可以看出,YV12 和 I420 基本上是一样的,就是 UV 的顺序不同。

继续我们的话题,经过第一次数据压缩后 RGB24->YUV(I420)。这样,数据量将减少一半,为什么呢?呵呵,这个就太基础了,我就不多写了。同样,如果是 RGB24->YUV(YV12),也是减少一半。但是,虽然都是一半,如果是 YV12 的话效果就有很大损失。然后,经过 X264 编码后,数据量将大大减少。将编码后的数据打包,通过 RTP 实时传送。到达目的地后,将数据取出,进行解码。完成解码后,数据仍然是 YUV 格式的,所以,还需要一次转换,这样 windows 的驱动才可以处理,就是 YUV2RGB24。

YUY2 是 4:2:2 [Y0 U0 Y1 V0]

yuv420p 和 YUV420的区别

在存储格式上有区别
yuv420p:yyyyyyyy uuuuuuuu vvvvv
yuv420: yuv yuv yuv

YUV420P: Y,U,V三个分量都是平面格式,分为I420和YV12。I420格式和YV12格式的不同处在U平面和V平面的位置不同。在I420格式中,U平面紧跟在Y平面之后,然后才是V平面(即:YUV);但YV12则是相反(即:YVU)。

YUV420SP: Y分量平面格式,UV打包格式, 即NV12。 NV12与NV21类似,U 和 V 交错排列,不同在于UV顺序。

I420: YYYYYYYY UU VV =>YUV420P
YV12: YYYYYYYY VV UU =>YUV420P
NV12: YYYYYYYY UVUV =>YUV420SP
NV21: YYYYYYYY VUVU =>YUV420SP

【轴承故障诊断】基于融合鱼鹰和柯西变异的麻雀优化算法OCSSA-VMD-CNN-BILSTM轴承诊断研究【西储大学数据】(Matlab代码实现)内容概要:本文提出了一种基于融合鱼鹰和柯西变异的麻雀优化算法(OCSSA)优化变分模态分解(VMD)参数,并结合卷积神经网络(CNN)与双向长短期记忆网络(BiLSTM)的轴承故障诊断模型。该方法利用西储大学公开的轴承数据集进行验证,通过OCSSA算法优化VMD的分解层数K和惩罚因子α,有效提升信号分解精度,抑制模态混叠;随后利用CNN提取故障特征的空间信息,BiLSTM捕捉时间序列的动态特征,最终实现高精度的轴承故障分类。整个诊断流程充分结合了信号预处理、智能优化与深度学习的优势,显著提升了复杂工况下轴承故障诊断的准确性与鲁棒性。; 适合人群:具备一定信号处理、机器学习及MATLAB编程基础的研究生、科研人员及从事工业设备故障诊断的工程技术人员。; 使用场景及目标:①应用于旋转机械设备的智能运维与故障预警系统;②为轴承等关键部件的早期故障识别提供高精度诊断方案;③推动智能优化算法与深度学习在工业信号处理领域的融合研究。; 阅读建议:建议读者结合MATLAB代码实现,深入理解OCSSA优化机制、VMD参数选择策略以及CNN-BiLSTM网络结构的设计逻辑,通过复现实验掌握完整诊断流程,并可进一步尝试迁移至其他设备的故障诊断任务中进行验证与优化。
内容概要:本文档《统信服务器操作系统行业版安全加固指导》针对统信UOS(服务器行业版)操作系统,提供了全面的安全配置与加固措施,涵盖身份鉴别、访问控制、安全审计、入侵防范、可信验证和数据传输保密性六大方面。文档依据国家等级保护三级标准制定,详细列出了58项具体的安全加固项,包括账户锁定策略、密码复杂度要求、SSH安全配置、日志审计、文件权限控制、系统服务最小化、防止IP欺骗、核心转储禁用等内容,并给出了每项配置的操作命令和检查方法,旨在提升主机系统的整体安全性,满足等保合规要求。; 适合人群:系统管理员、信息安全工程师、运维技术人员以及负责统信UOS服务器部署与安全管理的专业人员;具备一定的Linux操作系统基础知识和安全管理经验者更为适宜。; 使用场景及目标:①用于统信UOS服务器系统的安全基线配置与合规性检查;②指导企业落实网络安全等级保护制度中的主机安全要求;③在系统上线前或安全整改过程中实施安全加固,防范未授权访问、信息泄露、恶意攻击等安全风险;④作为安全审计和技术检查的参考依据。; 阅读建议:建议结合实际生产环境逐步实施各项安全配置,操作前做好系统备份与测试验证,避免影响业务正常运行;同时应定期复查配置有效性,关注系统更新带来的安全策略变化,确保长期符合安全基线要求。
内容概要:本文介绍了基于MATLAB实现的RF-XGBoost混合集成模型,用于多特征分类预测。该模型结合随机森林(RF)与极端梯度提升(XGBoost)的优势,构建多层混合架构:RF作为基础筛选层进行特征重要性评估与降维,XGBoost作为精细建模层进行高阶非线性关系挖掘与残差优化。项目涵盖完整的数据预处理、特征工程、样本均衡、模型训练与评估流程,并提供可视化分析功能,有效应对高维数据、样本不均衡、过拟合等挑战,提升分类准确率与模型泛化能力。文中还给出了部分示例代码与系统设计思路,支持多领域应用扩展。; 适合人群:具备一定机器学习基础,熟悉MATLAB编程,从事数据分析、智能预测相关工作的科研人员、工程师及高校师生;适用于工作1-3年希望提升集成学习实战能力的技术人员。; 使用场景及目标:①应用于医疗诊断、金融风控、智能制造等领域中的多特征多类别分类任务;②解决高维数据下的维数灾难、样本不均衡与模型可解释性问题;③构建稳定、高效、可扩展的智能预测分析平台。; 阅读建议:此资源以实际项目为导向,强调理论与实践结合,建议读者在学习过程中动手复现代码,结合MATLAB平台调试模型参数,深入理解RF与XGBoost的融合机制,并尝试在自有数据集上迁移应用,以掌握完整建模流程与优化技巧。
音频均衡处理技术作为声学工程的核心环节,旨在通过调节信号中各频段的能量分布来优化听觉效果或适配特定声学场景。本资料集系统梳理了均衡器实现所涉及的关键算法模块,包括IIR梳状滤波器结构、IIR滤波器设计原理、频域时域转换方法、增益调控机制、品质因数参数以及多种滤波形态。以下对各部分进行分述。 IIR梳状滤波器属于数字滤波器的一种特殊架构,其频率响应呈现周期性起伏特性,形似梳齿排列。该结构通过反馈回路实现,能在频域形成间隔均匀的共振峰与陷波点,常用于实现选择性频带增强或抑制。虽然其计算效率较高且设计灵活,但需注意可能引发的相位畸变问题。 IIR滤波器采用递归计算方式,当前输出值依赖于输入序列与历史输出值的加权组合。此类滤波器能以较低计算复杂度实现包括低通、高通、带通及带阻在内的多种滤波特性,并能获得显著的阻带衰减效果,但在参数设计时需关注系统稳定性条件。 傅里叶逆变换是频域处理至时域重建的关键数学工具。在均衡处理流程中,通常先将时域信号转换至频域进行谱线调整,再通过逆变换重构为时域波形,这一过程保证了频率编辑操作的可逆性与精确性。 增益参数用于控制信号幅度的缩放比例,在均衡器中特指对指定频段能量进行的提升或衰减操作。品质因数则表征滤波器带宽与中心频率的相对关系:较高品质因数对应较窄的通带范围,有利于精细的频率微调;较低品质因数则形成宽频带调节效果。 滤波形态根据通带位置可分为四类基本类型:低通型保留低频分量而抑制高频成分,适用于消除高频噪声;高通型则相反,用于滤除低频干扰;带通型仅允许以特定频率为中心的窄带信号通过,适合突出人声等特征频段;带阻型则在特定频段形成衰减凹口,可有效抑制固定频率干扰。 本资料整合了均衡器算法实现的全链路技术要素,从滤波器设计、频域处理到参数调控形成完整知识体系。掌握这些基础理论有助于音频技术人员科学地进行频谱塑形,实现符合声学目标的信号处理效果。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值