人类视觉运动感知与光学流网络的比较及相关理论分析
1. 人类视觉运动感知与光学流网络的相似性
人类视觉运动感知与光学流网络的响应行为存在令人惊讶的相似性。目前已知的生理数据尚未明确支持某种特定的实现方式,需要进一步的实验和分析来确定唯一的机制。
1.1 神经模型与归一化
基于相关机制的神经模型会将最大兴奋分配给其偏好运动最接近所需最优估计的中颞叶(MT)神经元。为了实现稳健的神经实现,归一化似乎是必要的,它能在较宽的运动能量幅度范围内提供清晰的MT响应。即使在整体幅度较低的情况下,MT群体响应也应足够强,以便选择出获胜神经元。第3章中提到的竞争性软赢家通吃(soft - WTA)网络可以执行这种归一化操作,它能放大群体响应曲线并增强获胜神经元的响应,从而实现对局部视觉运动的稳健估计。soft - WTA网络依赖于局部兴奋和全局抑制,有趣的是,抑制在产生MT神经元的方向和速度调谐方面起着关键作用。
1.2 感知动态与梯度下降动态的相似性
人类的稳态视觉运动感知不仅与约束满足问题的最优解相似,其感知的时间演变也类似于平滑光流芯片的梯度下降动态。假设MT区域的神经元代表局部视觉运动估计,那么这种动态应反映在MT群体活动的动态中。近期的生理实验结果支持了这一观点,在这些实验中,测量了MT模式细胞在刺激开始后不同时间的方向调谐曲线。当呈现的刺激中模式运动与成分运动不同时,方向调谐曲线会随时间变化。在刺激开始后的早期响应阶段,方向调谐曲线强烈偏向成分运动的矢量平均方向,只有在60毫秒的延迟后,方向调谐才与神经元对整体模式运动的偏好方向一致,这与光流网络的梯度下降动态完全匹配。
1.3 相似性的启示
这
超级会员免费看
订阅专栏 解锁全文
1114

被折叠的 条评论
为什么被折叠?



