自然图像方差统计学习
1. 引言
人类能够轻松区分自然图像、人造图片和随机噪声图像。若随机为每个像素分配亮度值来构建图像,得到的随机图像几乎不可能呈现出自然场景的样子。这是因为自然图像的统计结构与简单噪声图像有很大不同,自然图像中相对像素位置的亮度值之间存在复杂的依赖关系。目前,自然图像的真实统计特性尚未得到很好的描述,由于其复杂性,找到一个简洁的自然图像统计描述较为困难。
许多人认为早期感觉系统中的神经元能有效地表示感官信息。在过去二十年里,这一理论被用于推导处理自然信号的高效编码。独立成分分析(ICA)和稀疏编码等方法应运而生,它们将信号线性变换到新的表示形式,使各个成分尽可能统计独立。这些方法在处理自然图像时得到的基函数类似于初级视觉皮层中简单细胞的局部感受野。
然而,大多数此类算法假设输入信号是由独立源信号的线性混合生成的,对于自然信号,这种线性假设大多不成立。实际上,自然信号经过这些线性滤波器后的响应仍存在显著的依赖关系。显然,这些线性模型不足以捕捉自然图像的复杂统计结构,特别是如何表示或建模高阶图像结构仍是一个未解决的问题。一些近期的研究尝试通过线性滤波器的累积幅度或精确值来建模高阶依赖关系。
本文采用一种编码输入图像统计信息的方法,类似于Karklin和Lewicki最近提出的分层协方差模型,但不同的是,我们直接学习自然图像的方差表示。我们假设自然图像中所有像素位置的联合概率可分解,且每个像素位置的亮度值分布服从广义高斯分布(GGD)。通过最大似然法,我们证明可以直接从原始自然信号中学习到分布式稀疏表示,避免了分层网络中首次线性ICA过程。我们的主要发现是,当直接将方差表示应用于自然图像时,会出现新的基函数族,包括多尺度斑点、类Gabor光栅和类
超级会员免费看
订阅专栏 解锁全文
36万+

被折叠的 条评论
为什么被折叠?



