应用3D目标坐标学习其6D姿态估计(笔记)——2014
《Learning 6D Object Pose Estimation using 3D Object Coordinates》
摘要
文章以单帧RGB-D图像估计特定目标的6D姿态,该方法可灵活地应对有无纹理目标,核心思想是一种学习的中间表示,冠以稠密的3D目标坐标标记与类标签配对的形式,是一种具有稠密学习特性的基于特征的方法。
引言
- 多年来,对刚体的检测和2D / 6D姿态估计的主要限制于具有足够纹理量的物体。
- 对于有纹理目标,成功的关键是使用局部特征的稀疏表示,要么通过手工设计,例如,SIFT功能,要么从数据中训练。通常分两步:(a)假假定的稀疏特征匹配,(b)匹配特征的几何验证。
- 对检测无纹理或弱纹理刚体目标,基于模板的方法更有优势。但却有两个基本问题:
(1)将完整模板与图像匹配,编码全局特征。而基于稀疏特征的表示是“局部的”,因此在遮挡方面更加鲁棒。
(2)由于所需模板数不断增加,使其难以用于铰链的或可变形的对象实例以及对象类。 - 文中的方法:(思想来源于【24】【28】)
首先,回归一个中间的物体坐标表示,图像中的每个像素都以规范姿势投票给规范体上的连续坐标,称为Vitruvian Manifold。投票由随机森林完成,并使用经过训练的简单局部特征测试组合。
其次,进行几何验证,通过定义1个能量方程,将这些对应关系与参数体模型进行比较。
最后,通过能量最小化得到姿态参数。
本质上,类似于传统的、基于稀疏特性的方法(a)和(b),具有密集的学习特性。 - 系统实现(图1),需2步:
(1)