场景识别与物体搜索技术:进展、局限与展望
1. 物体位置预测与搜索技术
在场景识别和物体搜索领域,结合所谓中间物体的已知位置与空间关系来预测被搜索物体未知位置的方法,为场景识别和物体搜索建立联系提供了合适的途径。以往通过空间关系预测物体位姿的方法存在一定局限性,例如仅预测 3 自由度位置而非完整的 6 自由度位姿,或者从单个物体位置估计而非部分识别的场景中推导位置,又或者使用粗略的符号关系而非精确的度量关系进行预测,这些方法无法满足相关要求。
我们提出的物体位姿预测方法由场景模型采样和实际位姿预测算法两部分组成,克服了上述局限性。场景模型采样的目的是减少自动场景识别(ASR)过程中的计算成本,它将识别返回的大量不完整场景估计减少到可处理的规模,避免位姿预测算法处理过多数据。位姿预测算法则根据识别结果,结合其所在隐式形状模型(ISM)树中的空间关系,分别推导出可能的位姿云。
在解决 ASR 背景下的物体搜索问题方面,文献中的三种方法虽可无缝集成到我们的 ASR 机器人架构中,但都无法完全满足要求。这些方法在寻找最合适的相机视图时,考虑的可到达视图数量有限,可能导致不合适的结果。为了满足相关要求,我们开发了有针对性的目标函数和启发式近似算法,将物体搜索形式化为组合优化问题。该算法仅返回下一个视图以及要在其中搜索的物体,避免了对非即时未来视图进行估计的成本,可将节省的成本用于扩大搜索空间和使用简洁的目标函数。
2. 现有技术的局限性
尽管我们提出的算法、数据结构和机器人架构取得了一定进展,但在场景识别和物体搜索中仍存在一些问题。
2.1 ISM 树的局限性
ISM 树在精确建模物体相对位姿的同时,牺
超级会员免费看
订阅专栏 解锁全文

47

被折叠的 条评论
为什么被折叠?



