时间机会主义者:自监督多帧单目深度 The Temporal Opportunist: Self-Supervised Multi-Frame Monocular Depth

本文介绍了一种名为Manydepth的新方法,它是一种自监督多帧单目深度估计模型,通过结合单帧和多视图深度估计的优势,引入了一种新的损失来缓解运动物体带来的估计问题,并提出了一种自适应成本量的方法来克服单目序列自监督训练中的尺度歧义。

The Temporal Opportunist: Self-Supervised Multi-Frame Monocular Depth

时间机会主义者:自监督多帧单目深度

0 Abstract

  大多数的单目深度估计网络在训练时都没有采用时间序列最为约束信息,本文提出了一种Manydepth,基于立体匹配,提出了一种基于端到端成本量的深度估计网络,并且提出了新的一致性损失,在面对运动物体时,鼓励网络忽略掉成本量,并且提出了一种应对静态相机的增强方案,在KITTI和Cityscapes上效果良好。

1 Introduction

  理解图像中的逐像素深度信息已被证实是非常有用的工具,其广泛应用于增强现实,自动驾驶和三维重建。虽然专业硬件例如结构化光和激光雷达传感器可以给出每像素深度,但是其依赖昂贵的硬件支持,这使得无需硬件辅助的自监督单目深度估计方法得到了大量的关注。虽然自监督单目深度估计非常有前途,但是目前还无法和专业深度硬件和深度多视图方法相提并论。
  为了缩小性能差距,我们利用了在大多数方法中被忽略的时间序列信息,我们共做出一下三项贡献:

  • 一种新的自监督多帧深度估计模型,结合了单帧和多视图深度估计的优势。
  • 我们采用了一种新的损失来缓解运动物体在静态世界中的估计问题(即自适应忽略运动成本量)。
  • 剔除一个自适应成本量来克服单目序列自监督训练引起的尺度歧义。

2 Related work

  单目深度估计的目标是从图像中获得每个像素点 的深度信息,监督方法要么

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值