自监督单目深度估计：通过语义引导解决目标问题 Self-Supervised Monocular Depth Estimation:Solving the Dynamic Object Problem

最新推荐文章于 2024-10-11 10:06:12 发布

原创

最新推荐文章于 2024-10-11 10:06:12 发布 · 2.5k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

提出一种新的语义引导的深度估计方法来处理动态物体问题。采用有监督的语义分割和自监督的深度估计进行互利跨域训练，提供防止移动物体污染的光度损失的语义遮蔽方案。

Self-Supervised Monocular Depth Estimation:Solving the Dynamic Object Problem

(自监督单目深度估计：通过语义引导解决目标问题)

重投影损失：指当前观测到的位置与3D点按照当前位姿估计出来的位置相比较得到的误差。

0 摘要

提出一种新的语义引导的深度估计（SGDepth）方法来处理运动的动态类问题（DC）,例如运动的汽车和行人。采用有监督的语义分割和自监督的深度估计进行互利跨域训练，提供防止移动对象污染的光度损失的语义遮蔽方案，以及对非移动对象的检测方法。

1介绍

经典的基于模型的算法可以根据可以更具立体图像或图像序列预测深度，但是受到模型质量的限制。深度学习能够在激光雷达或者RGBD相机测量的监控下，从单个弹幕图像中预测深度，即有监督的深度估计。后续根据最小重投影损失引入了自监督的方法，并且通过最小化光度误差来优化深度，而不需要任何的标签。在这里插入图片描述
上图在源域下进行有监督的语义分割，在目标域下进行自监督的深度估计。在进行深度估计时，将已经训练好的语义分割网络用来指导深度估计过程，语义分割相当于预处理。例如输入的单张图片，先进行语义分割，再将语义分割的结果用来指导深度估计。
自监督单目深度估计目前有以下三个问题：

无法避免的遮挡问题，遮挡会诱发伪像。即遮挡问题会带来无法避免的重投影损失问题。
由于缺乏自我运动，帧间运动太小，导致不能推断

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。