视觉皮层与情感语音合成技术解析
视觉皮层的非线性ICA机制
在视觉信息处理领域,人类视觉系统(HVS)对图像数据的处理方式一直是研究的焦点。早在五十多年前,就有人提出HVS应使用尽可能相互独立的组件来表示图像数据,这就是所谓的高效编码假说。线性独立成分分析(ICA)在HVS的线性处理中得到了应用,通过优化一组线性滤波器,可以预测线性感受野的形状。然而,线性ICA基函数虽然能减少互信息,但无法完全消除冗余,因此需要一个非线性步骤来实现组件的独立性。
V1视觉皮层模型
这里所考虑的图像表示基于标准的心理物理和生理模型,该模型描述了早期视觉处理直至V1皮层的过程。输入图像首先由一组类似小波的线性传感器进行分析,这些传感器根据对比度灵敏度函数(CSF)具有频率相关的线性增益。传感器的加权响应根据除法归一化增益控制进行非线性变换。具体流程如下:
graph LR
A[x] -->|T| B[w]
B -->|S| C[w']
C -->|R| D[r]
其中,矩阵T的行包含V1神经元的感受野,这里由正交4尺度QMF小波变换建模;S是对角矩阵,包含用于建模CSF的线性增益;R是除法归一化响应,公式为:
[R(w’) i = r_i = \text{sign}(w’_i) \frac{|S_i \cdot w_i|^{\gamma}}{\beta_i^{\gamma} + \sum {k=1}^{n} H_{ik}|S_k \cdot w_k|^{\gamma}}]
其中,H是控制相邻线
超级会员免费看
订阅专栏 解锁全文
885

被折叠的 条评论
为什么被折叠?



