视觉信号的经验统计与随机模型
视觉问题在计算机视觉领域常被表述为贝叶斯推理问题。早在约公元 1000 年,阿拉伯科学家伊本·海瑟姆就意识到从二维图像重建三维信息是不适定的,需要推理。在现代,许多人对视觉感知背后的推理进行了研究。
贝叶斯公式在视觉问题中的表述如下:设 $I$ 为观察到的图像,$w$ 为描述生成图像的外部场景的变量。需要两个从过去经验中学习的随机模型:先验模型 $p(w)$ 指定我们生活的世界中可能出现的场景,成像模型 $p(I|w)$ 指定给定场景下图像的样子。根据贝叶斯规则:
[p(w|I) = \frac{p(I|w)p(w)}{p(I)} \propto p(I|w)p(w)]
贝叶斯推理是固定 $I$ 的观察值,推断 $w$ 取使 $p(w|I)$ 最大的值,即等价于使 $p(I|w)p(w)$ 最大。但要实现或测试这个框架,需要:
1. 一种全面的随机模型理论,能表达变量 $w$ 和 $I$ 遵循的复杂但可变的模式。
2. 一种从经验中学习这些理论所含众多参数的方法。
3. 一种计算 $p(w|I)$ 最大值的方法。
本文主要关注第一个问题。下面将回顾构建这些模型的一些进展,包括图像的经验概率分布模型、图像结构的分组问题以及二维形状的先验问题。
1. 图像的统计特性
1.1 高 kurtosis:离散结构的通用线索
滤波器响应的一个显著特点是具有大的 kurtosis(峰度)。峰度定义为归一化的四阶矩:
[κ(x) = \frac{E((x - \overline{x})^4)}{E((x - \overline{x})^2)^2}]
对于图
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



