特征检测的非线性模型
1. 引言
人类视觉系统的一项主要任务是快速且轻松地从图像中提取最显著的信息,以形成场景的符号表示。Marr提出的“原始草图”概念强调了这一点,它是对原始场景的早期且高度简化的抽象表示,并非简单的图像缩减或采样版本,而是包含线条、圆柱体等基本形式的高度非线性漫画,能捕捉场景的本质,忽略大量细节和亮度的渐变。
常见的视觉特征包括线条和边缘,它们都是丰富的视觉信息源。线条传递信息的潜力在艺术草图中得到了很好的体现,而边缘在界定物体边界方面显然很重要。虽然在某种程度上,线条和边缘可以互换,但从数学角度看,它们是截然不同且正交的:边缘可描述为奇对称函数,线条为偶对称函数。
由于这两个同样重要的特征是正交的,定义了一个二维特征空间,因此我们认为需要一个二维基集来检测它们。并且,两个基的非线性组合是检测线条和边缘的最有效方法。
许多线条和边缘检测模型都有一个主要共同点:将图像与各种大小的简单线性算子进行卷积,并在输出中搜索最大值或零交叉点。然而,这种方法存在一些困难,特别是当图像特征相邻,或者特征是线条和边缘的组合时。
我们的线条和边缘检测方法与其他方法不同,我们试图理解线条和边缘对视觉的重要性,并为视觉特征提供了一个可靠的操作定义。我们的模型与大多数模型一样,将图像与有限带宽的线性算子进行卷积,但它需要两组相互正交(通过希尔伯特变换相关)的线性算子。此外,它还包含两个主要的非线性:二阶(平方)非线性用于组合匹配滤波器的输出,以及高阶“非最大抑制”非线性,只有在组合输出中产生最大值的点才被视为对构建视觉信息有效的特征。
2. 特征检测的局部能量模型
我们的模型需要两组匹配算子,一组是偶对
超级会员免费看
订阅专栏 解锁全文
2144

被折叠的 条评论
为什么被折叠?



