V1小波模型与计算机视觉应用解析
1. 线性与非线性映射
在视觉信息处理中,尺度空间和滤波器组范式的主要空间算子通常是线性的,这些线性算子与许多经典V1感受野的空间特性密切相关。不过,实际上大多数V1感受野具有复杂的性质,通常表现出空间相位不变性或其他未明确的非线性特性。
为了实现特定角度的相位不变响应,可以采用非线性组合的方式。例如,为了生成边缘可能性的相位和方向不变度量,可以对所有相位和方向的响应进行“池化”。具体来说,如果同一方向的两个感受野相位完全正交,那么生成相位不变响应所需的线性感受野数量可减少到两个,即同相和正交分量,这与正交检测以及复Gabor函数相关。
2. 极可分离复小波设计
2.1 设计概述
为了模拟多个感受野尺度,采用双通道、分层的方法,在低通通道中进行抽取,通过金字塔结构的连续层级实现滤波器响应的缩放。为了方便调整滤波器的角度和径向特性,可以在傅里叶域中施加极可分离性。分析滤波器 $G_{0,k}(\omega,\varphi)$ 可表示为径向频率函数 $\Omega_0(\omega)$ 和角频率函数 $\Phi_{0,k}(\varphi)$ 的乘积,即 $G_{0,k}(\omega,\varphi) = \Omega_0(\omega)\Phi_{0,k}(\varphi)$;匹配的合成滤波器 $G_{1,k}(\omega,\varphi)$ 可表示为相同的角频率函数 $\Phi_{0,k}(\varphi)$ 和合成径向频率函数 $\Omega_1(\omega)$ 的乘积。
设计流程如下:
1. 确定双通道分层结构,在低通通道进行抽取。
2. 施加傅里叶