此主要讨论图像处理与分析。虽然计算机视觉部分的有些内容比如特 征提取等也可以归结到图像分析中来,但鉴于它们与计算机视觉的紧密联系,以 及它们的出处,没有把它们纳入到图像处理与分析中来。同样,这里面也有一些 也可以划归到计算机视觉中去。这都不重要,只要知道有这么个方法,能为自己 所用,或者从中得到灵感,这就够了。
8. Edge Detection
边缘检测也是图像处理中的一个基本任务。传统的边缘检测方法有基于梯度 算子,尤其是 Sobel 算子,以及经典的 Canny 边缘检测。到现在,Canny 边缘检 测及其思想仍在广泛使用。关于 Canny 算法的具体细节可以在 Sonka 的书以及 canny 自己的论文中找到,网上也可以搜到。最快最直接的方法就是看 OpenCV 的源代码,非常好懂。在边缘检测方面,Berkeley 的大牛 J Malik 和他的学生 在 2004 年的 PAMI 提出的方法效果非常好,当然也比较复杂。在复杂度要求不高 的情况下,还是值得一试的。MIT的Bill Freeman早期的代表作Steerable Filter 在边缘检测方面效果也非常好,并且便于实现。这里给出了几篇比较好的文献, 包括一篇最新的综述。边缘检测是图像处理和计算机视觉中任何方向都无法逃避 的一个问题,这方面研究多深都不为过。
[1980] theory of edge detection
[1983 Canny Thesis] find edge
[1986 PAMI] A Computational Approach to Edge Detection
[1990 PAMI] Scale-space and edge detection using anisotropic diffusion
[1991 PAMI] The design and use of steerable filters
[1995 PR] Multiresolution edge detection techniques
[1996 TIP] Optimal edge detection in two-dimensional images
[1998 PAMI] Local Scale Control for Edge Detection and Blur Estimation
[2003 PAMI] Statistical edge detection_ learning and evaluating edge cues
[2004 IEEE] Edge Detection Revisited
[2004 PAMI] Design of steerable filters for feature detection using canny-like criteria
[2004 PAMI] Learning to Detect Natural Image Boundaries Using Local Brightness, Color, and Texture Cues
[2011 IVC] Edge and line oriented contour detection State of the art
翻译
学习使用局部亮度,颜色和纹理提示来检测自然图像边界——http://tongtianta.site/paper/56224
作者:David R. Martin, Member, IEEE, Charless C. Fowlkes, and Jitendra Malik, Member, IEEE
摘要 -这项工作的目的是使用局部图像测量来准确地检测和定位自然场景中的边界。 我们制定功能以响应与自然边界相关的亮度,颜色和纹理特征变化。 为了以最佳方式组合来自这些功能的信息,我们使用人类标记图像作为地面实况来训练分类器。 该分类器的输出提供每个图像位置和方向上的边界的后验概率。 我们提供了精确的召回曲线,显示出所得的检测器明显优于现有方法。 我们的两个主要结果是:1)可以使用简单的线性模型充分执行提示组合; 2)需要适当的显式纹理处理才能检测自然图像中的边界。
索引词-纹理,监督学习,提示组合,自然图像,地面真相分割数据集,边界检测,边界定位。
1 引言
考虑图1所示的图像和人类标记的边界。我们如何自动找到这些边界?
图1:示例图像和带有人类标记的线段边界。 每个图像显示多个(4-8)人体分割。 像素越暗,更多的人标记边界。 第3节讨论了如何收集地面数据的详细信息。
我们将边界检测的问题与传统上称为边缘检测的问题区分开。边界是图像平面中的轮廓,表示像素所有权从一个对象或一个表面到另一个对象或表面的变化。相反,边缘通常被定义为某些低级图像特征(例如亮度或颜色)的突然变化。因此,边缘检测是一种通常用于边界检测目标的低级技术。另一种方法是识别场景中的对象,并使用该高级信息来推断边界位置。
图2:本地图像特征。在每一行中,第一面板显示一个图像补丁。以下面板显示了沿着贴片水平直径的特征轮廓。特征是原始图像强度,定向能量OE,亮度梯度BG,颜色梯度CG,原始纹理梯度TG,d和局部纹理梯度TG。每个配置文件中的垂直线标记了补丁中心。选择每个功能的比例是为了最大化训练图像集的性能-OE,CG和TG占图像对角线的2%(5.7像素),BG占图像对角线的1%(3像素)。挑战在于将这些功能结合起来以检测和定位边界。
在本文中,我们关注于局部图像补丁中可用的信息,如图2第一栏中所示。尽管这些补丁