人类3D形状感知与早期视觉的几何统一
在计算机视觉和人类视觉研究中,理解3D形状感知以及早期视觉任务的整合是重要的课题。下面将深入探讨相关的概念和理论。
有目的的视觉
在解决通用视觉系统的大问题时,研究者发现解决针对个别应用的小问题可能更现实。例如,机器人应主动智能地搜索与当前任务相关的新信息,并测试感知假设,而非被动地尝试重建整个3D场景。“有目的的”这一术语最早在1932年由行为主义者托尔曼使用,后来维纳及其同事也使用了该术语。目前,人类行为和思维具有目的性已得到广泛认可,但视觉是否具有目的性尚无证据。虽然观察者的目的会影响视觉注意力,且视觉系统一次只能分析少数对象,但除了这两个限制外,人类视觉系统是一个通用系统。
先验约束
格式塔心理学家在上世纪上半叶就认识到感知涉及先验简单性约束的操作。但由于当时缺乏数学工具,这些想法未能立即形成正式理论。直到1948年信息论出现,1941年之后才能够进行计算机模拟,1963年逆问题理论及其解决方法才被提出,1985年才明确指出逆问题、正则化理论、贝叶斯推理和简单性约束对于解释视觉都是必要的。
人类视觉感知是一个困难的逆问题,尤其是在3D形状感知方面。当观察者看到自然3D场景的2D图像时,会将其感知为3D。有研究表明,对于非结构化对象,形状恒常性可能完全失效;而对于对称多面体等对象,形状恒常性在所有观察条件下都接近完美。这说明深度线索对于实现形状恒常性既不是必要条件也不是充分条件,而有效的先验约束才是实现形状恒常性的必要且充分条件。
不过,先验约束也可能导致较大的感知误差。例如,在实验室设计的实验中,当先验约束(对称性和紧凑性)与深度线索提供的信息冲突时,观察者会忽略深度线索
超级会员免费看
订阅专栏 解锁全文
1913

被折叠的 条评论
为什么被折叠?



