场景识别与物体搜索技术的进展、局限与展望
1. 物体位置预测与搜索技术
在场景识别与物体搜索的研究中,结合中间物体的已知位置和空间关系来预测被搜索物体未知位置的方法,对于建立场景识别和物体搜索之间的联系十分合适。不过,现有的一些通过空间关系预测物体姿态的方法存在局限性。
部分现有方法仅预测 3 - 自由度(3 - DoF)的位置,而非完整的 6 - 自由度(6 - DoF)姿态。并且,它们要么从单个物体位置估计中推导位置,而非从部分识别的场景中;要么使用粗略的符号关系而非精确的度量关系进行实际预测,无法满足相关要求。
为克服这些局限,提出了一种物体姿态预测方法,包含场景模型采样和实际姿态预测算法两个独立技术。场景模型采样的目的是减少自动场景识别(ASR)过程中的计算成本,将识别返回的大量不完整场景估计数量减少到可处理的规模,这些估计原本都需要由姿态预测算法处理。姿态预测算法根据要求 6,通过将每个识别结果与该结果所源自的隐式形状模型(ISM)树中的空间关系相结合,分别推导出可能姿态的云图。
在解决 ASR 背景下的物体搜索问题时,有三种现有方法可无缝集成到 ASR 机器人架构中,但都无法完全满足要求 7。主要问题在于,它们在寻找最合适的相机视图时,考虑的可到达相机视图数量有限,可能导致不恰当的结果,即用于进行物体定位的下一个最佳视图选择不当。
为满足要求 7 并更真实地模拟潜在问题,开发了有针对性的目标函数和启发式近似算法,将物体搜索形式化为组合优化问题。该算法仅返回下一个视图以及要在其中搜索的物体,而非返回未来视图的完整序列,将避免为非即时未来生成估计的成本重新投入到增加搜索空间大小和使用简洁的目标函数中。
超级会员免费看
订阅专栏 解锁全文
5651

被折叠的 条评论
为什么被折叠?



