摘要
我们展示了一个有效的3D目标检测框架,基于一个单RGB图,在自动驾驶方案。我们努力去提取潜在的3D信息在一个2D图像,以及确定精确的3D框目标,没有使用点云或者立体数据。利用现成的2D目标检测器,我们提出了一个巧妙的方法来有效获得一个粗长方体对每一个预测的2D框。这个粗长方体有足够的精度去引导我们决定3D框的目标通过定义。相对于先前先进的方法,只是使用特征提取从2D框来定义框,我们提出的3D框架信息在目标通过利用视觉特征这可见的表面。新的特征从表面用来消除的问题是,展现歧义的带来通过只用一个2D框。另外,我们调查不同方法在3D框定义和发现一个分类公式在质量意识损失有较好的表现比回归方法。在KITTI基准上评估,我们的方法表现优于单签先进的方法在使用单张RGB图像基于3D目标检测。


了解更多关于《计算机视觉与图形学》相关知识,请关注公众号:

下载我们视频中代码和相关讲义,请在公众号回复:计算机视觉课程资料
本文提出一种基于单RGB图像的高效3D目标检测框架,该框架能够在不依赖点云或立体数据的情况下,准确地从2D图像中提取3D信息并定义目标的3D边界框。相较于现有技术,此框架利用表面视觉特征改进了目标识别的准确性,解决了仅凭2D框带来的歧义问题。实验结果显示,在KITTI基准上,该方法在3D目标检测方面超越了当前的先进方法。

被折叠的 条评论
为什么被折叠?



