遮挡物体识别的研究进展与挑战
1. 物体识别的基础现象
在物体识别过程中,呈现物体各部分的时间不同步会显著影响识别表现。研究发现,即使时间延迟短至 16 毫秒,物体识别性能也会受到干扰,而且这种干扰在生理层面也有明显体现。这表明,将物体各部分在空间上整合为一个整体进行识别的能力,对各部分同步呈现的偏差非常敏感。
早期视觉区域在处理遮挡和虚幻轮廓时,若对应边缘在空间上接近,会出现轮廓完成现象。不过,在某些情况下,这些轮廓完成反应相对于真实轮廓反应和高级视觉区域的反应会有延迟。而负责物体识别的高级视觉区域,其生理信号对大面积遮挡具有较强的鲁棒性,与行为识别表现一致,并且这些生理信号也存在明显延迟。这些延迟被认为源于物体完成过程中循环和/或自上而下连接的参与。
2. 计算模型的发展
过去十年,物体识别计算模型取得了显著进展。这些模型大致基于初级视觉皮层中简单细胞和复杂细胞的基本原理,提出了线性滤波和非线性最大运算的分层序列。早期的物体识别模型由此类操作串联而成,近年来,这些理念在计算机科学领域以深度卷积神经网络(CNNs)的形式得到了广泛应用。生物启发模型和旨在在基准数据集上取得良好性能的深度卷积神经网络具有相似的核心架构。
2.1 前馈模型在识别遮挡物体中的表现
前馈计算模型的典型步骤受到麻醉猫初级视觉皮层中简单细胞和复杂细胞观察结果的启发。Hubel 和 Wiesel 发现了对特定方向条形刺激有反应的“简单”细胞,以及对偏好方向有反应且对刺激空间平移有一定容忍度的“复杂”细胞。他们假设复杂细胞通过对简单细胞进行类似最大运算的池化操作来实现空间不变性,从而对条形刺激的空间位置不敏感。
像 HMAX
超级会员免费看
订阅专栏 解锁全文
1014

被折叠的 条评论
为什么被折叠?



