VVC/VTM：帧间预测——Decoder side motion vector refinement (DMVR)

最新推荐文章于 2024-02-28 18:21:03 发布

小马甲不被占用

最新推荐文章于 2024-02-28 18:21:03 发布

阅读量2.8k

点赞数

分类专栏： VVC (H266)

本文链接：https://blog.youkuaiyun.com/baidu_28446365/article/details/89294356

版权

文章目录

- Decoder side motion vector refinement (DMVR)

Decoder side motion vector refinement (DMVR)

在第13次Marrakech会议之后被正式写入标准，前期调研过程中的JEM文档中也介绍过DMVR（解码端运动矢量修正）技术，因为中间好久没有仔细跟过每次会议，发现这两次文档中的DMVR已经发生了很大的变化，下面把JEM和VTM中的做法都进行仔细的总结。

为了增加merge模式中MV的准确度，采用一种基于解码端运动矢量修正的双边匹配（bilateral matching），基本原理是在参考帧list0和参考帧list1中的初始MV附近搜索一个refined MV作为新的MV。

JEM中的做法

双向预测：编解码器首先根据两个MV（list0中的MV0和list1中的MV1）从两个不同的参考帧中获取两个预测块Pred0和Pred1，然后将两者进行加权得到当前CU的预测块。

DMVR：在DMVR中，双向预测中的两个MV（MV0和MV1）通过双向模板匹配(bilateral template matching)过程得到进一步的修正（简单来说就是使得MV更加精准，减小预测误差）。
DMVR用于双向预测的Merge模式，且要求两个参考帧分别为了当前帧的不同方向。它无需传输任何语法元素，在JEM中，当LIC、Affine、FRUC或sub-CU merge候选使用时，DMVR不使用。

步骤

JEM中基于双边模板匹配的DMVR

生成双边模板：根据MV0和MV1得到两个预测块Pred0和Pred1，然后将两者加权组合（例如：平均）得到双向模板Pred(bilateral template)；注：MV0和MV1从merge候选列表中得到；
模板匹配过程：对于每个方向，编解码器在初始预测块（Pred0和Pred1）周边搜索下图所示9个位置点（相当于9个MV候选），包括自身位置和8个周边位置，这8个周边位置相较于自身的偏移MV为一个亮度样点（水平偏移或垂直偏移、或水平垂直都偏移）。分别计算9个MV偏移情况下新生成的预测块 $Pred0^{’}$ 和 $Pred1^{’}$ ，并将两者加权组合得到当前块的预测块 $Pred^{’}$ ，计算 $Pred^{’}$ 与双向模板Pred之间的SAD值。将SAD最小者的MV作为新的MV，得到 $MV0^{’}$ 和 $MV1^{’}$ 。

模板匹配搜索位置点

VTM中的做法

基本原理还是跟JEM里面的差不多，如下图所示都是在Merge候选MV附近搜索更加精准的MV，但是这里判定最佳位置点的标准是计算图中两个预测块（红色块，相当于JEM中的 $Pred0^{’}$ 和 $Pred1^{’}$ ）之间的SAD，选取SAD最小的作为refined MV（修正后的MV），并生成最终双向预测块。