人造铰接物体的无监督姿态感知部件分解
1. 引言
在我们的日常生活环境中,人造铰接物体无处不在,像家具、家用电器(如抽屉和烤箱),以及桌面物品(如眼镜和笔记本电脑)等。人类能够依据部件运动学,将这些物体分解为更简单的语义部件,从而实现对它们的识别。研究表明,即使是非常小的婴儿,也能利用位置、形状和运动学作为线索,甚至从单张图像中学会将物体分组为语义部件。然而,对于机器而言,尤其是在缺乏丰富监督的情况下,实现这样的推理具有挑战性。
从单帧观察中实现对形状和姿态的3D部件级理解,在计算机视觉和机器人领域有着广泛的应用。以生成式方法用更简单的部件组件来表示复杂目标形状,能够支持诸如结构建模和无监督3D部件解析等应用。不过,以往的无监督方法主要聚焦于非铰接物体,它们利用一致的部件位置作为线索将形状分组为语义部件,在考虑动态部件位置的运动学时,这些方法并不适合分解铰接物体。对于部件姿态,将运动学结构建模为关节参数在机器人操作的运动规划和增强现实中的环境交互等方面有诸多应用。但现有的判别式方法在对人造铰接物体进行部件姿态估计和分割时,需要明确的监督,如分割标签和关节参数。消除对这种昂贵监督的需求,是迈向更类人表示学习的重要一步。
在本研究中,我们探讨了针对带机械关节的人造铰接物体的无监督部件分解任务,以无监督的方式将部件姿态视为关节参数。具体考虑具有单自由度关节状态的旋转和棱柱部件,因为它们涵盖了常见人造铰接物体的大多数运动学类型。该任务旨在从单帧形状观察中,为具有各种部件姿态的人造铰接物体学习一致的部件解析,作为一种生成式形状抽象方法。
2. 相关工作
2.1 无监督部件分解
现有的无监督生成式部件分解研究大多假设部件形状
超级会员免费看
订阅专栏 解锁全文
1225

被折叠的 条评论
为什么被折叠?



