基于扩展卡尔曼滤波的图像序列形状与运动学习及混沌动力学建模
1. 视觉感知与预测机制
在视觉感知中,将世界视为一个连续变化的序列,而非离散的快照集合,能让近期经验在对后续情况的预期或预测中发挥作用。感知系统中的预测具有两个重要功能:
- 当传入的感官信号与预期一致时,可进行智能滤波,利用上下文信息提高信噪比并解决歧义。
- 当信号违背预期时,生物体可通过弱化信号的预期部分,将更多处理能力投入到意外信息上,快速应对变化或显著的情况。这可通过处理层之间的自上而下连接、层内的横向连接或两者结合来实现。横向连接能让关于移动轮廓的局部约束引导预期,这也是模型的基础。
2. 网络架构设计
在高维空间中进行预测,使用全连接网络架构计算复杂。为减少自由参数数量,受真实视觉系统分层架构的启发,设计了一个类似的分层网络,包含输入层、两个隐藏层和输出层,具体为 100 - 16 - 8R - 100 的四层网络。
- 输入层 :将 10×10 像素的训练图像转换为 100×1 的向量形式作为输入,并将其划分为四个 5×5 的非重叠感受野。
- 第一隐藏层 :16 个单元分为四组,每组四个单元,每组单元接收一个感受野的输入,用于处理局部特征。
- 第二隐藏层 :8 个单元,具有层内递归连接,用于组合第一隐藏层学习到的局部特征。
- 输出层 :表示预测的下一个图像。
预测误差用于 EKF 方程更新权重,该过程在训练图像序列上重复多个周期,直到获得足够小的增量均方误差。 </
超级会员免费看
订阅专栏 解锁全文
1873

被折叠的 条评论
为什么被折叠?



