视觉皮层计算理论探索
在视觉信息处理的研究中,多个关键领域的进展为理解视觉计算机制提供了重要线索。下面将详细介绍这些领域的相关内容。
1. 双目视差处理
双目视差处理在视觉深度感知中起着关键作用。通过对左右眼视觉信息的处理,能够计算出视差,进而恢复物体的深度信息。
具体来说,存在一种特定的双目视差处理模型——能量模型。该模型先对左右眼的视觉信号进行特定处理(例如针对右眼的相关处理),然后进行能量求和。这种单元对特定的相位和位置视差有偏好,并且一组这样的细胞能够表示整个视野中的所有视差。由于立体感官设备所看到的任何物体都会产生与观看深度和外观相关的特定视差信号模式,因此利用视差可以恢复深度信息,且深度与视差成反比关系。
基于特定的相位和位置视差,可以从单眼情况直接推导出复杂细胞的概念。通过对具有相同调谐偏好(包括视差、方向和空间频率)且相位正交的细胞进行能量计算,能够得到复杂细胞。这种单元对特定的相位和位置视差具有选择性,同时具有相位不变性,而位置不变性可以通过最大池化来实现。一些模型还会对方向和/或空间频率进行池化,以减少噪声并确保细胞群体在真实视差处达到峰值,这样的细胞对输入刺激的功率谱变化具有鲁棒性。在初级视觉皮层中,还发现了对双目视差调谐且对对比度反转不变的复杂细胞。
2. 运动处理
静态的Gabor函数可以扩展到时空域,通过引入与时间相关的相位项,使Gabor函数的周期性部分在单元感受野内随时间漂移。这将简单细胞从静态图像功率谱采样的概念推广到了从图像序列的功率谱随时间采样的概念。由此产生的细胞对空间频率、方向和时间频率具有选择性。
同样地,利用能量模型,将一对具有相同偏好位置和调谐偏好(
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



