视频双层分割技术解析
1. 引言
视频中的前景层提取是一个重要的研究领域,在远程会议等实时背景替换场景中有广泛应用。传统的基于光流估计的运动分割方法存在诸多限制,如需要对底层运动进行假设、在层边界引入不准确以及计算成本高。本文提出了一种新的方法,避免了对像素速度的显式估计,而是通过时空导数从标记数据中学习有效的判别模型来区分运动和静止。
1.1 现有方法的局限性
- 光流估计法 :通常通过估计光流并根据预定义的运动模型对像素进行分组,但这种方法需要对运动性质进行假设,且正则化会在层边界引入误差,计算成本高。
- 基于颜色/对比度的分割 :对于静态图像,利用颜色/对比度线索的交互式分割技术很有效,但完全自动的方法难以仅依靠颜色/对比度进行分割。
1.2 本文方法的优势
- 单目实现 :避免了使用立体相机及其校准的不便,且在运动方面的效率更高,无需评估立体匹配可能性。
- 融合多线索 :融合了多种线索,如颜色、对比度和空间先验,能在实时计算的同时达到较高的分割精度。
- 引入时间一致性 :通过建模时间转移概率,减少闪烁伪影并明确检测时间遮挡,提高分割精度。
1.3 符号和图像可观测值
给定输入图像序列,帧表示为 YUV 颜色空间中的像素数组 $z = (z_1, z_2, …, z_n, …, z_N
超级会员免费看
订阅专栏 解锁全文
1248

被折叠的 条评论
为什么被折叠?



