SSD-6D: Making RGB-Based 3D Detection and 6D Pose Estimation Great Again—2017(笔记)
SSD-6D让RGB图像的3D检测和6D姿态估计更出色—2017(笔记)
文章以单帧RGB图像为输入,基于扩展的SSD范式,采用InceptionV4深度网络,预测目标2D bounding box以及目标种类、离散视点和面内旋转在每个特征图位置的得分,通过射影几何特性构建目标的6D姿态池,最终通过姿态池优化ICP得到精确结果。
通过单位球面等距采样获得目标的离散6D姿态空间,供深度网络完成训练
摘要
- 我们提出了一种新颖的方法来检测3D模型实例并从单次拍摄中的RGB数据估计其6D姿态。
- 为此,我们扩展了流行的SSD范例以覆盖整个6D姿态空间,并仅在合成模型数据进行训练。
- 我们的方法可以与现有的方法相媲美或超越,后者可以在多个具有挑战性的数据集上利用RGBD数据。
- 此外,我们的方法在10Hz左右产生这些结果,比相关方法快许多倍。为了重现性,我们将经过培训的网络和检测代码公开发布。
引言
- 大多数性能最好的3D检测器都遵循基于视图的范例,其中会生成一组离散的对象视图,并用于后续的特征计算[31、14]。
- 在测试过程中,在离散位置对场景进行采样,计算特征,然后将其与对象数据库进行匹配,以在训练视图和场景位置之间建立对应关系。
- 特征可以是图像属性(颜色渐变,深