HM代码阅读1: 帧间预测函数Void TEncSearch::predInterSearch()

最新推荐文章于 2021-08-30 22:11:09 发布

原创

最新推荐文章于 2021-08-30 22:11:09 发布 · 582 阅读

3 ·

CC 4.0 BY-SA版权

本文回顾了AMVP（Adaptive Motion Vector Prediction）理论知识，包括其在HM编码器中的作用，即加速运动估计并减少比特传输。介绍了HM获取最佳MVP的流程，涉及遍历参考图像列表，进行运动估计和成本比较。同时，简述了GPB（Generalized B-frames）的概念，它在low-delay B帧编码中的应用，并指出在HM代码中，xCompressCU() 和 xCheckRDCostInter() 函数调用predInterSearch() 进行相关处理。

AMVP理论知识简单回顾(含GPB)

MVP主要是为了给当前PU提供一个运动矢量的预测，可加快ME的计算速度以及提升准确性。并且在后续编码中也只用编码MVD，减少了传输bit数。
HM中获取每个参考图像列表最佳MVP的流程：

遍历refPicList0中的每一帧，为每一帧创建AMVP候选。RDO选出最优MVP。
根据最优MVP进行运动估计，得到当前最优的MV。
根据MV再次比较AMVP候选中哪一个MVP最优，获取最优MVP存入cMVPred中，还需存储最优MVP在当前候选列表中的索引，将计算得到的bit数、cost存入变量中用于后续对比。
对比当前cost与最优cost，若当前cost更小，则将tempMV存入cMV中，并存下当前参考帧在参考图像列表中的索引值。
重复步骤1-4，直到遍历完所有参考帧。

此时能够获得，当前参考图像列表中最优MV 以及对应的参考帧索引。 refPicList1同理计算。但是在遍历refPicList1的所有参考帧时，若当前参考帧能在List0中找到对应的参考帧，则属于无效MV，不需要存储。若找不到，则存在mvValidList1中。

GPB：
广义B帧，主要用于low-delay B帧下的视频编码。此时把P帧看作B帧，依然有两个参考图像列表，但是List0和List1中存入相同的参考帧。
在compressGOP中，设置好参考图像列表后，会检查是不是广义B帧，若两个参考图像列表相同，则是广义B帧，对应的MVDzeroFlag会被置为1

HM代码入口：
xCompressCU() -> xCheckRDCostInter() -> predInterSearch()

代码跟踪：

#if AMP_MRG
Void TEncSearch::predInterSearch( TComDataCU* pcCU, TComYuv* pcOrgYuv, TComYuv* pcPredYuv, TComYuv* pcResiYuv, TComYuv* pcRecoYuv DEBUG_STRING_FN_DECLARE(sDebug), Bool bUseRes, Bool bUseMRG )
#else
Void TEncSearch::predInterSearch( TComDataCU* pcCU, TComYuv* pcOrgYuv, TComYuv* pcPredYuv, TComYuv* pcResiYuv, TComYuv* pcRecoYuv, Bool bUseRes )
#endif
{
   
   
  for(UInt i=0; i<NUM_REF_PIC_LIST_01; i++)
  {
   
   
    m_acYuvPred[i].clear(); //清空两个参考图像列表的YUV预测数据
  }
  m_cYuvPredTemp.clear();
  pcPredYuv->clear(); //清空该CU预测YUV数据

  if ( !bUseRes )
  {
   
   
    pcResiYuv->clear();
  }

  pcRecoYuv->clear();

  TComMv       cMvSrchRngLT;
  TComMv       cMvSrchRngRB;

  TComMv       cMvZero;
  TComMv       TempMv; //kolya

  TComMv       cMv[2];
  TComMv       cMvBi[2];
  TComMv       cMvTemp[2][33];

  Int          iNumPart    = pcCU->getNumPartitions();
  Int          iNumPredDir = pcCU->getSlice()->isInterP() ? 1 : 2; //预测方向，P帧单向预测，B帧双向预测

  TComMv       cMvPred[2][33];

  TComMv       cMvPredBi[2][33];
  Int          aaiMvpIdxBi[2][33];

  Int          aaiMvpIdx[2][33];
  Int          aaiMvpNum[2][33];

  AMVPInfo     aacAMVPInfo[2][33];

  Int          iRefIdx[2]={
   
   0,0}; //If un-initialized, may cause SEGV in bi-directional prediction iterative stage.
  Int          iRefIdxBi[2];

  UInt         uiPartAddr;
  Int          iRoiWidth, iRoiHeight;

  UInt         uiMbBits[3] = {
   
   1, 1, 0};

  UInt         uiLastMode = 0;
  Int          iRefStart, iRefEnd;

  PartSize     ePartSize = pcCU->getPartitionSize( 0 );

  Int          bestBiPRefIdxL1 = 0;
  Int          bestBiPMvpL1 = 0;
  Distortion   biPDistTemp = std::numeric_limits<Distortion>::max(); //初始化为unsigned int型的最大值

  TComMvField cMvFieldNeighbours[MRG_MAX_NUM_CANDS << 1]; // double length for mv of both lists
  UChar uhInterDirNeighbours[MRG_MAX_NUM_CANDS];
  Int numValidMergeCand = 0 ;

  for ( Int iPartIdx = 0; iPartIdx < iNumPart; iPartIdx++ ) //遍历当前划分后的PU
  {
   
   
    Distortion   uiCost[2] = {
   
    std::numeric_limits<Distortion>::max(), std::numeric_limits<Distortion>::max() };
    Distortion   uiCostBi  =   std::numeric_limits<Distortion>::max();
    Distortion   uiCostTemp;

    UInt         uiBits[3];
    UInt         uiBitsTemp;
    Distortion   bestBiPDist = std::numeric_limits<Distortion>::max();

    Distortion   uiCostTempL0[MAX_NUM_REF];
    for (Int iNumRef=0; iNumRef < MAX_NUM_REF; iNumRef++)
    {
   
   
      uiCostTempL0[iNumRef] = std::numeric_limits<Distortion>::max();
    }
    UInt         uiBitsTempL0[MAX_NUM_REF];

    TComMv       mvValidList1;
    Int          refIdxValidList1 = 0;
    UInt         bitsValidList1 = MAX_UINT;
    Distortion   costValidList1 = std::numeric_limits<Distortion>::max();

    xGetBlkBits( ePartSize, pcCU->getSlice()->isInterP(), iPartIdx, uiLastMode, uiMbBits); //根据条类型及划分尺寸来确定bit

    pcCU->getPartIndexAndSize( iPartIdx, uiPartAddr, iRoiWidth, iRoiHeight ); //根据划分类型 选择ROI区域大小；确定PU的位置索引

#if AMP_MRG
    Bool bTestNormalMC = true;

    if ( bUseMRG && pcCU->getWidth( 0 ) > 8 && iNumPart == 2 ) //若使用merge模式且，CU尺寸大于8x8，划分为两块PU，则不进行运动补偿.
    {
   
   
      bTestNormalMC = false;
    }

    if (bTestNormalMC)
    {
   
   
#endif

    //  Uni-directional prediction //对两个参考图像列表分别选出最佳MVP以及最佳MV
    for ( Int iRefList = 0; iRefList < iNumPredDir; iRefList++ )
    {
   
   
      RefPicList  eRefPicList = ( iRefList ? REF_PIC_LIST_1 : REF_PIC_LIST_0 );

      for ( Int iRefIdxTemp = 0; iRefIdxTemp < pcCU->getSlice()->getNumRefIdx(eRefPicList); iRefIdxTemp++ ) //遍历参考图像列表中的所有参考帧
      {
   
   
        uiBitsTemp = uiMbBits[iRefList];
        if ( pcCU->getSlice()->getNumRefIdx(eRefPicList) > 1 )
        {
   
   
          uiBitsTemp += iRefIdxTemp+1;
          if ( iRefIdxTemp == pcCU->getSlice()->getNumRefIdx(eRefPicList)-1 )
          {
   
   
            uiBitsTemp--;
          }
        }
		/*
		预测AMVP：
		input：
		*当前CU，pcCU
		*原始YUV数据，pcOrgYuv
		*当前PU索引，
		*参考图像列表，
		*当前参考帧,
		*当前参考帧的MVP信息
		*是否填满了候选
		*当前失真情况
		output：
		当前参考帧最佳MVP
		*/
        xEstimateMvPredAMVP( pcCU, pcOrgYuv, iPartIdx, eRefPicList, iRefIdxTemp, cMvPred[iRefList][iRefIdxTemp], false, &biPDistTemp);
        aaiMvpIdx[iRefList][iRefIdxTemp] = pcCU->getMVPIdx(eRefPicList, uiPartAddr); //0 or 1
        aaiMvpNum[iRefList][iRefIdxTemp] = pcCU->getMVPNum(eRefPicList, uiPartAddr); //2

        if(pcCU->getSlice()->getMvdL1ZeroFlag() && iRefList==1 && biPDistTemp < bestBiPDist) //GPB? low-B模式中 将P帧按B帧处理，此时list0与list1是一样的
        {
   
   
          bestBiPDist = biPDistTemp;
          bestBiPMvpL1 = aaiMvpIdx[iRefList][iRefIdxTemp];
          bestBiPRefIdxL1 = iRefIdxTemp;
        }

        uiBitsTemp += m_auiMVPIdxCost[aaiMvpIdx[iRefList]