用CNN_卷积自编码器:深度学习局部 RGB-D Patches for 3D Object Detection and 6D Pose Estimation—2016(笔记)
深度学习局部RGB-D补丁实现3D目标检测和6D姿态估计
文章采用神经网络与基于局部投票相结合的方法,以卷积自动编码器(CAE)回归特征描述符,实现与包含局部6D姿态投票的密码本进行匹配,最后通过投票和过滤的方法得到最终精确结果。
相关工作中将基于模板和基于特征的方向进行了梳理。
对比了基于模板的方法[14,27,18]与基于描述符的方法[23,13,2]以及基于随机森林的方法[5,30],之后引出CNN法
摘要
- 文章提出了一种3D对象检测方法,该方法使用局部采样的RGB-D patch的回归描述符进行6D投票。
- 对于回归,我们使用卷积自动编码器,该编码器已经在大量随机局部补丁上进行了训练。
- 在测试期间,场景补丁描述符与合成模型视图补丁的数据库匹配并投射6D对象投票,随后将这些投票过滤到重新设定的假设。
- 我们对三个数据集进行评估,以表明我们的方法很好地概括了以前看不见的输入数据,提供了强大的检测结果,可以在对象数量可扩展的同时与现有技术竞争并超越现有技术。
引言
-
受到[32]的启发,我们证明:神经网络与基于局部投票的方法结合可用于在杂波和遮挡下执行可靠的3D物体检测和姿态