【论文】单目深度估计:Unsupervised Monocular Depth Estimation with Left-Right Consistency

Unsupervised Monocular Depth Estimation with Left-Right Consistency

#摘要
不像之前的有监督的方法一样,利用深度图作为标签(GT),本文的方法用容易得到的双目图来训练。利用epipolar geometry constraints。我们通过训练我们的网络来产生视差图像,使其具有图像重建的损失。结果表明,仅对图像重建进行求解就会导致图像质量较差。为了解决这个问题,我们提出了一个全新训练损失,它加强了相对于左图像和右图像产生的差异之间的一致性,与现有的方法相比,这将提高性能和健壮性。

#介绍
然而,这些技术大多依赖于对感兴趣的场景进行多次观察的假设。因此现在提出了很多机遇单眼深度估计的监督学习方法。但是这种方法需要很多的有标签的深度图,这个代价很大。而我们的全卷积模型不需要任何深度数据,而是被训练成将深度合成为一个中间值。
我们的算法有如下3个贡献:
1.一种网络结构,它执行端到端无监督的单目深度估计,并产生一种新的训练损失,使网络内部的左右深度一致。
2.对几种训练损失和图像形成模型的评估突出了我们的方法的有效性
3.除了展示在一个具有挑战性的数据集上的最优结果外,我们还展示了我们的模型在三个不同的数据集上的结果,包括我们自己收集的一个新的户外城市数据集,我们公开地收集这些数据集。

#相关工作
相关的一些工作往往对数据集有很多的限制,比如需要同个场景多张图像,不同角度,时间序列不同光照等等,而我们的方法就是着眼于单目深度估计,且没有任何其他的假设条件。
1.通过对比两张图像每个像素点间的差距,来得到深度。这种方法缺点就是数据难易获取,需要较大的人力。
2.单视图或单目深度估计是指在测试时只有一个图像可用的问题设置。而之前的方法基本上都是要讲深度相机拍到的深度图作为标签的,而这种标签图也很难得到。而我们也进行单深度图像估计,但增加了双目彩色图像,而不是要求地面真深度,所以我们的方法被称为无监督深度估计。
3最近,人们提出了一种基于深度网络的新视图合成和深度估计方法,这种方法在训练时不需要地面真实深度

1.DeepStereo:在测试时,他需要从其他图中提取

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yuanCruise

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值