密集运动估计技术解析
1. 视频稳定化应用
视频稳定化是参数化运动估计最广泛使用的应用之一。它既可以在硬件设备(如摄像机和静态相机)中运行,也可以在软件包中实现,以提高抖动视频的视觉质量。
视频稳定化主要包括三个主要阶段:
- 运动估计 :通常使用相似变换来处理相机的平移、旋转和缩放。关键在于让算法锁定由相机运动引起的背景运动,而不受独立移动的前景对象的干扰。
- 运动平滑 :恢复运动的低频(缓慢变化)部分,然后估计需要去除的高频抖动分量。
- 图像变形 :应用高频校正,使原始帧看起来就像相机只经历了平滑运动。
然而,得到的稳定化算法虽然可以大大改善抖动视频的外观,但往往仍包含视觉伪影。例如,图像变形可能导致图像周围出现缺失的边框,这需要进行裁剪、使用其他帧的信息填充或使用修复技术进行处理。此外,在快速运动期间捕获的视频帧通常会模糊,可以使用去模糊技术或从运动较少或对焦更好的其他帧中获取更清晰的像素来改善其外观。
在相机在3D中大量平移的情况下,例如摄像师在行走时,更好的方法是对相机运动和3D场景进行完整的运动结构重建。然后可以计算出平滑的3D相机路径,并使用视图插值重新渲染原始视频,同时保留显著特征。如果可以使用相机阵列而不是单个摄像机,则可以使用光场渲染方法获得更好的效果。
2. 学习运动模型
与使用仿射变换等几何变形对运动场进行参数化不同,可以学习一组针对特定应用定制的基函数。具体步骤如下:
1. 从一组训练视频中计算出一组密集运动场。
2. 对运动
超级会员免费看
订阅专栏 解锁全文
2073

被折叠的 条评论
为什么被折叠?



