图像与视频压缩技术:深入解析运动补偿与编码方法
1. 运动补偿基础
在视频处理中,运动补偿是一项关键技术,它能有效减少视频数据量,提高压缩效率。为了更好地理解运动补偿,我们先从预测残差的概念说起。
1.1 预测残差
预测残差是通过比较不同帧之间的灰度值差异得到的。假设存在一个假设视频的两帧,如下面的图所示:
图9.20 (a)和(b)是假设视频的两帧,(c)是没有进行运动补偿的缩放预测残差,(d)是进行运动补偿后的预测残差,(e)是描述物体运动的运动向量。
预测残差的三个可能值是由灰度值255(物体白色)和75(背景灰色)形成的差值。若不考虑物体运动,预测残差包含三个值(即 -180, 0, 和180);而当考虑物体运动时,预测残差只有一个值 —— 0,此时运动补偿后的残差不包含信息,其熵为0,仅需图9.20(e)中的运动向量就能从(a)帧重建(b)帧。
在实际情况中,运动向量是针对非重叠的矩形区域(称为宏块)计算的,而非单个物体。一个运动向量描述了关联宏块中每个像素的运动(即方向和移动量),它定义了像素相对于前一帧或参考帧位置的水平和垂直位移。
1.2 运动估计
运动估计是运动补偿的关键。在运动估计中,每个宏块的运动被测量并编码为一个运动向量。该向量的选择是为了最小化关联宏块像素与参考帧中预测像素之间的误差。
常用的误差度量之一是绝对失真总和(SAD),其计算公式如下:
[SAD(x,y) = \sum_{i=1}^{m} \sum_{j=1}^{n
视频压缩技术:运动补偿与编码方法解析
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



