The Temporal Opportunist: Self-Supervised Multi-Frame Monocular Depth
时间机会主义者:自监督多帧单目深度
0 Abstract
大多数的单目深度估计网络在训练时都没有采用时间序列最为约束信息,本文提出了一种Manydepth,基于立体匹配,提出了一种基于端到端成本量的深度估计网络,并且提出了新的一致性损失,在面对运动物体时,鼓励网络忽略掉成本量,并且提出了一种应对静态相机的增强方案,在KITTI和Cityscapes上效果良好。
1 Introduction
理解图像中的逐像素深度信息已被证实是非常有用的工具,其广泛应用于增强现实,自动驾驶和三维重建。虽然专业硬件例如结构化光和激光雷达传感器可以给出每像素深度,但是其依赖昂贵的硬件支持,这使得无需硬件辅助的自监督单目深度估计方法得到了大量的关注。虽然自监督单目深度估计非常有前途,但是目前还无法和专业深度硬件和深度多视图方法相提并论。
为了缩小性能差距,我们利用了在大多数方法中被忽略的时间序列信息,我们共做出一下三项贡献:
- 一种新的自监督多帧深度估计模型,结合了单帧和多视图深度估计的优势。
- 我们采用了一种新的损失来缓解运动物体在静态世界中的估计问题(即自适应忽略运动成本量)。
- 剔除一个自适应成本量来克服单目序列自监督训练引起的尺度歧义。
2 Related work
单目深度估计的目标是从图像中获得每个像素点 的深度信息,监督方法要么

本文介绍了一种名为Manydepth的新方法,它是一种自监督多帧单目深度估计模型,通过结合单帧和多视图深度估计的优势,引入了一种新的损失来缓解运动物体带来的估计问题,并提出了一种自适应成本量的方法来克服单目序列自监督训练中的尺度歧义。
最低0.47元/天 解锁文章
578

被折叠的 条评论
为什么被折叠?



