稠密运动估计技术:原理、应用与发展
1. 光流估计的新进展
光流估计是计算机视觉中一个重要的研究领域,用于计算图像序列中像素的运动。近年来,基于马尔可夫随机场的组合优化方法开始出现,并且在新发布的光流数据库中表现出色。
例如,Glocker 等人(2008)开发的技术采用了从粗到细的策略,结合每个像素的 2D 不确定性估计。他们使用 Fast - PD 算法进行离散位移标签的组合搜索,而不是传统的梯度下降法来优化光流估计,这种方法能够找到更好的能量极小值。
Lempitsky 等人(2008)则使用融合移动(fusion moves)方法,基于基本光流算法(如 Horn 和 Schunck 1981 年、Lucas 和 Kanade 1981 年提出的算法)生成的建议来寻找解决方案。融合移动的基本思想是用更基本技术生成的假设(或其偏移版本)替换当前最佳估计的部分,并与局部梯度下降交替进行,以实现更好的能量最小化。
光流评估网站(http://vision.middlebury.edu/flow/)是了解最新高性能算法的一个很好的资源。
2. 多帧运动估计
以往,运动估计常被视为两帧问题,即计算一个运动场使一幅图像的像素与另一幅图像的像素对齐。但在实际应用中,运动估计通常应用于视频,可利用整个帧序列来完成任务。
一种经典的多帧运动估计方法是使用定向或可转向滤波器对时空体积进行滤波(Heeger 1988),类似于定向边缘检测。通过对时空体积的水平切片分析,可以看到像素运动的斜率,对应着它们的水平速度。时空滤波利用每个像素周围的 3D 体积来确定时空的最佳方向,直接对应像素的速度。
超级会员免费看
订阅专栏 解锁全文
419

被折叠的 条评论
为什么被折叠?



