Self-Supervised Monocular Depth Estimation:Solving the Dynamic Object Problem
重投影损失:指当前观测到的位置与3D点按照当前位姿估计出来的位置相比较得到的误差。
0 摘要
提出一种新的语义引导的深度估计(SGDepth)方法来处理运动的动态类问题(DC),例如运动的汽车和行人。采用有监督的语义分割和自监督的深度估计进行互利跨域训练,提供防止移动对象污染的光度损失的语义遮蔽方案,以及对非移动对象的检测方法。
1介绍
经典的基于模型的算法可以根据可以更具立体图像或图像序列预测深度,但是受到模型质量的限制。深度学习能够在激光雷达或者RGBD相机测量的监控下,从单个弹幕图像中预测深度,即有监督的深度估计。后续根据最小重投影损失引入了自监督的方法,并且通过最小化光度误差来优化深度,而不需要任何的标签。
上图在源域下进行有监督的语义分割,在目标域下进行自监督的深度估计。在进行深度估计时,将已经训练好的语义分割网络用来指导深度估计过程,语义分割相当于预处理。例如输入的单张图片,先进行语义分割,再将语义分割的结果用来指导深度估计。
自监督单目深度估计目前有以下三个问题:
- 无法避免的遮挡问题,遮挡会诱发伪像。即遮挡问题会带来无法避免的重投影损失问题。
- 由于缺乏自我运动,帧间运动太小,导致不能推断

提出一种新的语义引导的深度估计方法来处理动态物体问题。采用有监督的语义分割和自监督的深度估计进行互利跨域训练,提供防止移动物体污染的光度损失的语义遮蔽方案。
最低0.47元/天 解锁文章
2786

被折叠的 条评论
为什么被折叠?



