物体感知中的结构与绑定:从模型到人类认知
在物体感知和识别的研究领域,理解人类如何在各种变化下准确识别物体是一个核心问题。这不仅涉及到视觉系统如何处理图像信息,还关乎到认知过程中对物体结构的表征和绑定机制。
1. 人类物体恒常性的挑战
人类物体识别的一大难题是理解物体恒常性,即尽管视网膜接收到的图像存在变化,我们仍能识别物体的能力。这种能力主要体现在两个方面:
- 视角变化下的识别 :我们能够在各种视角下识别物体,尽管不同视角可能会在视网膜上呈现截然不同的图像。例如,我们可以从不同角度认出一辆汽车。然而,人类的物体识别对视角变化的鲁棒性是有限的。它对图像在视网膜上的位置、左右反射、缩放和某些深度旋转不敏感,但对图像平面内的旋转较为敏感,比如当物体倒置时,识别速度会明显变慢。
- 三维形状变化的泛化 :我们不仅能将物体识别为特定的实例,还能将其归类为某个类别,如“椅子”或“汽车”。此外,我们可以轻松识别已知物体类别的新成员,即使我们之前从未见过具有完全相同形状的物体。例如,第一次看到道奇蝰蛇,我们也能轻易将其识别为汽车。
这些特性使得人类物体识别难以用简单的几何定律来解释。基于投影几何定律的系统虽然能适应所有视角变化,但无法容忍物体形状的变化,而人类的识别能力却能做到这一点。
2. 基于结构描述的物体识别理论
为了解释人类的物体识别能力,一些研究者提出我们是基于物体各部分之间的关系来识别物体的。其中最具代表性的理论是比德曼(Biederman)的成分识别理论。该理论认为,物体被表示为特定类别关系中的几何子(geons)集合。几何子是简单的体积,
超级会员免费看
订阅专栏 解锁全文
2324

被折叠的 条评论
为什么被折叠?



