基于超像素的感知分组与对象分解
1. 对象分解与识别
对象的分解在对象识别中起着重要作用。通过合并后的分解结果,可以根据区域数量及其空间关系来确定对象所属的类别。同时,考虑简单区域可能被划分成的基本区域,还能区分同一类别的不同对象。必要时,合并前的分解结果也可用于获取更多关于合并到相邻内核的简单区域结构的信息,这些区域实际上可细分为基本区域,以解释厚度或边界曲率的变化。
以不同姿势和大小的“马”对象为例,其骨架总是被划分为两个复杂集合(红色体素)和七个简单曲线(绿色体素)。简单曲线通过多边形近似被划分为不同子集,两个内核之间的简单区域总是与内核合并为一个独特区域。合并后,“马”总是被分解为一个主体(躯干),从主体伸出六个肢体(四条腿、尾巴以及包括头部和颈部的区域)。肢体在不同数量的基本区域中进行铰接,反映了“马”的不同姿势。通过观察合并前的分解结果,可以指出“马”躯干的弯曲情况,从而将这种姿势与其他姿势区分开来。
2. 感知分组的现状与挑战
感知分组在人类和计算机视觉中都起着关键作用。然而,随着对象分类领域对对象检测的关注,对感知分组的兴趣逐渐减弱。原因在于,构成感知分组基础的与对象无关的中级形状先验,被目标对象定义的与对象相关的高级形状先验所包含。
过去,对象识别的经典表述是从大型数据库中识别意外对象,特征提取过程通常从提取边缘开始,因为边缘在遮挡边界和表面不连续处能够捕捉形状信息。但局部边缘携带的信息很少,难以用于索引数据库中的对象。因此,早期系统中感知分组至关重要,只有将边缘分组成长轮廓,并与其他相关轮廓分组,才能出现独特的索引特征。
近年来,对象识别被重新表述为目标检测问题,即搜索特定目标对象。在这种情况下,
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



