视频编码
文章平均质量分 70
lock。
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【ECM技术】Non-adjacent special candidates技术
该技术修正了merge候选列表建立的过程。merge候选列表添加的顺序为:空域候选,图中的1-4TMVP不相邻的空域候选,图中的6-20(新增)HMVP成对平均MVP零候选其中不相邻的空域候选的推导如下:往外扩展四圈,每圈水平方向步长增加CUwidth,垂直方向步长增加CUheight。在每圈上找出五个坐标,由offsetX和offsetY共同定位,分别为0~4,如图所示。第一圈取0,1,4,剩余两圈均取五个。轮数为index,每轮水平偏移量为iHor=width*(index+1原创 2022-01-13 19:15:57 · 2238 阅读 · 4 评论 -
【ECM技术】局部光照补偿技术(LIC)
该技术的核心是当前块与参考块之间存在线性光照变化,并且此变化是线性变化。通过当前块和参考块的相邻重构像素(模板),拟合出线性函数a*p[x]+b来补偿光照变化。其中p[x]为参考块,a为缩放因子,b为偏移量,如下图所示其中a和b利用最小二乘法推导得到: LIC使用条件:CIIP模式和IBC模式禁用面积小于32的块禁用LIC flag 没有时域继承性生成merge候选列表时无需基于LIC flag进行修剪不可用于双向预测()LIC应用于1616的处理单元时,使用当前CU中左上原创 2022-01-13 15:47:54 · 2569 阅读 · 0 评论 -
【笔记】H.265/HEVC 视频编码(一)
为什么要进行视频压缩?就拿一个例子来说,720P的视频,假设帧率30fps,三个色彩分量的每个像素点为8bit,那么每一秒的数据量为12807203830=6.64*10^8比特,这还只是一秒的数据量,一部电影少也有90分钟左右,可见原始视频的数据量是非常惊人的,无法直接用于传输或存储,因此需要视频压缩。视频压缩的目的是尽可能去除视频数据的冗余成分,减少表征视频的数据量。一、视频压缩与编码概述1、视频视频的基本单位是图像,视频中完整的图像称为帧(Frame),许多帧按照时间顺序组成的视频称为视频序列原创 2020-09-05 21:41:27 · 1975 阅读 · 0 评论 -
【笔记】H.265/HEVC 视频编码(二)——数字视频格式
一、数字视频视频技术泛指一系列的图像以电信号的方式加以捕捉、记录、处理、存储、传送与重现的各种技术。数字视频即以数字形式记录的视频,数字视频由一幅幅数字图像组成,每幅图像由N行,每行M个像素组成,每个像素由数字化的数值表示。数字视频有视频分辨率、时间分辨率、帧率、色彩空间、量化深度等参数,这些参数的组合成为视频格式。时间分辨率即帧率,帧率越高流畅性越好,但当帧率到达一定程度后,再提高帧率,人眼是无法分辨出质量的好坏,因此,不必一味追求帧率。空间分辨率越高,图像细节越清晰。1、颜色空间(1)三基色原理原创 2020-09-08 16:25:28 · 3969 阅读 · 0 评论 -
【笔记】H.265/HEVC 视频编码(四)——预测编码
预测编码时视频编码中的核心技术之一。对于视频信号来说,一幅图像内邻近像素之间有较强的空间相关性,相邻图像之间有较强的时间相关性。因此采用帧内预测和帧间预测的方式,去除视频的空域和时域的相关性。视频编码器对预测后的残差进行变换、量化、熵编码,而不是对原始像素,大幅提高了编码效率一、视频预测编码技术1、预测编码原理预测编码是指利用已编码的一个或几个样本值,根据某种模型或方法,对当前样本值进行预测,并对样本真实值和预测值之间的差值进行编码。视频是一种有记忆信源,有记忆信源的两种有效编码方式是联合编码和条件编原创 2020-09-18 10:18:35 · 5166 阅读 · 1 评论 -
【笔记】H.265/HEVC 视频编码(五)——变换编码
图像变换编码是将空间域中像素形式描述的图像转换至变换域,以变换系数的形式加以表示,可使图像能量在空间域的分散分布转为在变换域的相对集中分布,已达到去除空间冗余的目的。H.264/AVC首次使用了整数DCT。H.265/HEVC沿用了整数DCT并进行了推广,还引入了DST。一、离散余弦变换DCT1、DCT原理数学里共存在八种类型的DCT,在图像、音视频编码等多媒体信号处理领域,使用的是Ⅱ类DCT,其逆变换对应于Ⅲ类DCT。Ⅱ类DCT的一维形式如下:其中,在图像、视频编码上主要使用二维DCT。其原创 2020-09-20 20:34:22 · 2780 阅读 · 2 评论 -
【笔记】HEVC 编码标准(六)——量化
量化是指将信号的连续取值(或大量可能的离散取值)映射为有限多个离散幅值的过程,实现信号取值多对一的映射。量化不可避免地引入失真。量化器可分为标量量化器和矢量量化器。目前主流的图像、视频编码标准都使用了标量量化器。一、标量量化1、基本原理标量量化是将一个幅值连续的信号映射成若干个离散的符号,如图所示,将横轴即输入信号划分为M个互不相交的区间(图中M=9):Iq=[tq,t(q+1) ),q=0,1,…,M-1tq为区间端点,称为量化器的判定边界。对于每个区间,分别取点x ̂q作为输出值,也称重建值原创 2020-09-28 21:16:22 · 4535 阅读 · 0 评论 -
【VTM10.0代码学习】帧间预测xCheckRdCostMerge2N*2N
xCheckRdCostMerge函数在xCompressCU中被调用,这里包括了常规Merge模式、CIIP模式和MMVD模式,GPM在xCheckRDCostGeo函数中。也就是说常规Merge、CIIP、MMVD共用一个代价列表,从中选出三个模式下的最优预测,同其他普通帧间、Affine模式再一同比较。 注释都写的比较详细,一部分参考了其他大神还有师兄的注释,让我刚入实验室就能更好的理解代码。代码片中有些宏是用来测试时间的,大家可以忽略。void EncCu::xCheckRDCostMer原创 2020-11-22 18:11:00 · 742 阅读 · 0 评论 -
【ECM技术】ECM(Enhanced Compression Model)帧间技术总结
1、LIC技术 (Local illumimation compensation)2、 Non-adjacent spatial candidate3、TM (Template matching)4、Multi-pass decoder-side motion vector refinement5、OBMC6、Sample-based BDOF7、Interpolation8、MHP(Multi-hypothesis prediction)——JVET-M04259、ARMC-TM(Adaptive re.原创 2022-01-12 11:12:52 · 3073 阅读 · 0 评论
分享