hevc编码芯片设计-数据重用

数据重用技术一般应用全搜索匹配(full search block-matching ,FSBM中)目的避免在搜索过程取出同一区域像素冗余仿存因子Ra用来衡量FSBM 仿存效率参数

Ra = 运动估计仿存数量 / 运动估计像素

TuanChen工作中根据视频编码器数据重用率数据复用分为4级别Level A~ level DLevel越高Level 最高代表数据复用级别越高数据复用率越高所需要仿存带宽要求越小

视频编码器仿存带宽视频帧率图像尺寸搜索范围有关如果数据重用那么仿存带宽应该冗余仿存因子Ra有关3参数取决于视频应用固定无法改变参数如果想要满足编码器仿存带宽需求只能通过优化视频编码器架构改变Ra数值达到目的因此对于FSBM来说Ra大小特别重要

值得注意提高编码器仿存效率会不可避免的增加片上存储面积因此设计视频编码器硬件架构时候必须权衡编码器仿存效率片上存储器面积

假设编码器当前大小NxN搜索范围横向[-Ph,Ph] 纵向[-Pv,Pv]矩形当前块对应搜索范围如图5-6所示

其中SRh = 2Ph,SRv = 2Pv 可以发现搜索每个所需要参考帧范围

(SRh + N - 1)x(SRv + N - 1)矩形因此相邻之间必定重合搜索范围

下面介绍数据重用4等级

LevelA

LevelA只有每个LCU相邻之间存在数据复用复用相邻水平方向(N-1)XN大小重叠区域像素如图5-7所示

1) LevelA 冗余访问因子Ra5-5)所示片上存储器大小 所示其中WH分别是图像宽度高度

2LevelB

LevelA一样LevelB只有每个LCU相邻之间存在数据复用但是LevelB除了复用相邻水平方向参考像素复用相邻块垂直方向参考像素如图5-8所示

LevelBRa计算方法如式5-7所示LMS如式5-8所示

Ra = W/N X H/N x(N + SRy - 1) x (N + SRh - 1)/WxH = (1 + SRv/N)x(1 + SRh/N)

3 ) LevelC

LevelALevelB不同LevelC可以复用相邻两个LCU之间搜索范围但是LevelC只能复用相邻LCU水平方向重叠搜索区域如图5-9所示其中SR 0代表LCU 0搜索范围SR1 代表LCU 1搜索范围

Chen 提出一种LevelC+ 级别数据重用方案通过垂直方向若干LCU组合在一起他们搜索区域可以一起载入片上存储

假如nLCU组合在一起那么所需要载入搜索区域大小Nx(SRv + nXN - 1) 5-10展示n = 2Level C示意图其中SR01代表LCU 0LCU 1组合一起时候搜索区域SR 2,3 代表了LCU2 LCU 3组合一起搜索区域

LevelC+Ra计算方法如式(5-11)所示LMS计算方法如式5-12所示

Ra = Nx(nN + SRv - 1)/NxnN ~ (1 + SRv/nN)

LMS = (N + SRh - 1)x(nN + SRv - 1)

  1. Level D

Level D可以完全复用水平垂直方向搜索范围但是同时也会使得片上存储器用量相对较大5-11 LevelD示意图

SRv + N - 1

SRh

LCU0

LCU2

LCU1

LCU3

Level DRa计算方式如式5-13所示LMS如式5-14所示

Ra = WxH/WxH = 1

LMS = (W + SRh - 1) x (SRv - 1)

5.1.2 现有成果

HEVC整像素运动估计模块的算法设计难点主要涉及分块过多,且搜索窗过大,搜索的计算复杂度过高。因此,很多工作都对这个问题提出了不同的解决方案。

Yang等,Yoo等和Shen等在整像素运动估计过程引入提前终止机制搜索结果满足设定某个条件之后便会结束搜索这个方法可以大大减少候选数目从而减少不必要搜索古城但是这种方法搜索过程随机性很大因而不适合硬件实现

Tsutake等提出了一种新的仿射运动估计的模型,该方案的主要优势在于针对编码器基于块的特性进行了优化,因此适用于主流的各种编码器,但是该运动估计的模块存在计算复杂度过高的问题。

Zhou等提出了一种两步搜索方案,该工作首先对一些视频序列进行搜索操作并分析最佳运动矢量的分布,发现运动矢量的水平分量大于垂直分量,且大部分运动矢量都是水平或者垂直方向的,对角线方向的较少。因此,Zhou等将搜索窗设置为水平+-211 垂直 +-106的菱形,适用于动态较大的视频场景,首先以菱形方式粗搜,而后以全搜索方式进一步精搜,但是,这种复杂的搜索模式会导致非常大的的仿存带宽。

Hu等同样采用了两步搜索方案。在粗糙过程中,仅在搜索起点附近中心区域对每个候选点进行搜索,而在其他区域,采用了降采样搜索。因此,该方案可以减少搜索点数目,大幅缩短搜索时间。

Dung等提出了一种双搜索窗 DSW 的方案,相较于Zhou等的设计,该方案引入了第二个可选参考窗,可以大幅减少仿存带宽。

Jiang 等提出了一种基于1/4 CTU,搜索范围为+-64 的搜索方案,将每个CTU划分为4个同等大小的QCTU,每个QCTU内的所有PU共享同一个搜索窗,且采用相同的搜索模式。

Paul改良了传统的SAD代价函数,将二维的图像块映射为一维矢量,这种方法可以大幅减少参考块匹配时的计算复杂度。

Kim等首先分析了 不同尺寸分块的最佳运动矢量分布,发现大块的运动矢量与其下小块的运动矢量的大小非常相似,因此该方案只对尺寸小于或者等于16x16的块做运动估计,而对尺寸大于16x16的块直接取左上角16x16块的MV作为其最佳MV。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值