基于非参数采样的视频深度提取技术解析
在计算机视觉领域,从视频中提取深度信息并将2D视频转换为3D视频是一个重要的研究方向。本文将详细介绍一种基于非参数采样的深度提取方法,该方法能够有效地从视频中提取深度信息,并实现更准确、时间连贯的深度估计。
1. 相关工作对比
与本文方法最接近的是Konrad等人的工作,他们同样使用非参数深度采样将单目图像自动转换为立体图像。不过,本文方法有两点改进:一是在计算深度图时,Konrad等人使用候选视差场的中位数并通过交叉双边滤波器进行平滑,而本文逐像素考虑候选深度和深度梯度;二是本文提出了结合视频时间信息的新解决方案,而Konrad等人的方法仅适用于单张图像。
2. 视频深度估计与2D转3D技术现状
目前存在多种视频2D转3D技术,但许多是交互式的。例如,Guttman等人的方法是在帧中添加具有深度属性的涂鸦以进行视频立方体传播;Ward等人的方法是用户指定基本形状的“深度模板”,系统将其在视频中传播;Liao等人的方法是用户借助光流传播运动结构信息。
也有一些自动的商业解决方案,如Tri - Def DDD,但试用版测试显示仍有改进空间。还有用于实时2D转3D视频转换的硬件,如Dialog Semiconductor的DA8223芯片,但由于通常基于运动估计对前景和背景区域做简单假设,其转换效果并不明确。此外,有一些专门从事2D转3D转换的制作公司,如In - Three和Identity FX, Inc.,但他们的解决方案是定制的,可能需要大量人工操作,且工具不公开。
如果视频适合使用运动结构和运动立体技术,这些技术可用于计算视频每一帧的密集深度图。例如Zhang等人的系统,还
超级会员免费看
订阅专栏 解锁全文
2150

被折叠的 条评论
为什么被折叠?



