MGNet:自动驾驶的单目几何场景理解 MGNet: Monocular Geometric Scene Understanding for Autonomous Driving

MGNet是针对自动驾驶的单目几何场景理解方法,结合了全景分割和自监督单目深度估计。文章提出了改进的DGC模块,优化了深度预测的精度。尽管在多任务学习中面临损失平衡和梯度冲突问题,MGNet通过引入同调不确定度解决了这一挑战。实验证明,该模型在速度和效果上都有良好表现,尤其在深度估计和全景分割的实时性上有所提升。

MGNet: Monocular Geometric Scene Understanding for Autonomous Driving

MGNet:自动驾驶的单目几何场景理解

  ok,浅浅的点评一下好吧,这一篇开头吧我还觉得不错的,作为开创性的工作,我最疑惑的地方是他怎么避免不同任务损失之间损失平衡和梯度爆炸的问题的,结果看完才发现,用的前人的同调不确定度。。。怎么说呢?这篇论文感觉就是投了很多论文的大佬写出来的好故事。叙述真是不错,但实际工作几乎没有,所谓的开创,2018年的同调不确定性就已经将语义,实例还有深度估计放在一起做多任务了,而本文只是把这三个都换成了当前的网络,还有,把以前的监督深度估计,换成了无监督深度估计,其他两个不出意外的话,还是监督(我没看到相关描述)。这就尴尬了呀,还有所谓的DGC模块,也是采用了2020的密集几何约束模块,刚好全景分割可以进行实例分割,以前的地面点不准确,现在刚好可以优化一下。除此之外,无他。主体还是放在了深度估计方向,我觉得也就是这个方向做的人少或者稿件到了不是深度估计方向的评委手里面,但凡这些人查一下文献,估计这篇论文都很难过了。不过这也没办法,方法部分细看的人太少了(除了像我这种做这个方向的会细究,谁会仔细的看方法呢?),前面介绍和当前工作讲的是真好,评委估计都被迷惑了。。。值得学习!

0 Abstract

  首次提出了单目几何场景理解,并将单目几何场景理解定义为全景分割和自监督单目深度估计(场景理解是计算机视觉中的一个大类,图像分割,检测,识别都算是里面的一种任务,这个定义有点勉强了,还以为是国人,没想到是英文名字)。本文注重于提升响应速度。在KITTI和Cityscapes上进行了测试,效果良好。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值