第十九周学习笔记

最新推荐文章于 2024-09-22 18:50:32 发布

luputo

最新推荐文章于 2024-09-22 18:50:32 发布

阅读量344

点赞数

CC 4.0 BY-SA版权

分类专栏：学习笔记

本文链接：https://blog.youkuaiyun.com/luo3300612/article/details/84973257

学习笔记专栏收录该内容

61 篇文章

订阅专栏

本文深入探讨计算机视觉中的特征检测与图像分割技术，包括边缘检测、线条识别、活动轮廓模型、图像分割方法如分水岭算法、基于图的分割及规范图割等。并介绍了基于特征的配准过程，如最小二乘法和RANSAC算法的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第十九周学习笔记

阅读：《计算机视觉——算法与应用》

第四章特征检测与匹配

4.2 边缘

相对特征点，边缘点更为丰富且常常包含重要的语义关联

4.2.1 边缘检测

边缘定义为亮度剧烈变化的位置，将图像想象为一个高度域，边缘出现在陡峭斜率上，斜率和方向是通过梯度实现的

$J(x)=∇I(x)=(∂I∂x,∂I∂y)(x)J(x)=\nabla I(x)=(\dfrac{\partial I}{\partial x},\dfrac{\partial I}{\partial y})(x)$

但是，求图像的导数强调了高频率的部分因而放大了噪声，因为噪声和信号的比例在高频部分较大，因此计算梯度之前需要考虑将图像用一个低通滤波器进行平滑，因为希望边缘检测器的响应与方向无关，所以需要一个圆对称的平滑滤波器。高斯函数是唯一可分离的圆对称滤波器，所以大多数边缘检测算法中都使用了它。jike

微分可与其他线性滤波操作交换

$J(\mathbf{x})=\nabla[G(\mathbf{x})*I(\mathbf{x})]=\nabla G(\mathbf{x})*I(\mathbf{x})$

因为

$\nabla[G(\mathbf{x})*I(\mathbf{x})]=\nabla[\sum_{k,l}G(i-k,j-l)I(k,l)]=\nabla G(\mathbf{x})*I(\mathbf{x})$

为了使得仅单个像素分布在沿着边缘轮廓的离散位置上，可以通过求梯度的极大值来找到，此时会涉及求高斯二阶导数的过零点问题，而实践中，常以高斯差分（DoG）代替高斯二阶导数。

计算出符号函数 $S (x)$ 后，通过找到满足以下条件的点来计算过零点的亚像素级位置

$[S(\mathbf x_i)>0]\not= [S(\mathbf x_j)>0]$

$\mathbf x_z = \dfrac{\mathbf x_iS( \mathbf x_j)-\mathbf x_jS(\mathbf x_i)}{S(\mathbf x_j)-S(\mathbf x_i)}$

亚像素级位置的计算是通过在过零点间进行线性插值计算的，当
$\mathbf{x}=\alpha x_i + (1-\alpha) x_j$

$S(\mathbf x)=\alpha S(\mathbf x_i) + (1-\alpha)S(\mathbf x_j)$

令 $S(x)=0S(\mathbf x)=0$ 求 $x\mathbf x$ 即可

尺度选择和模糊估计
如果只对强烈的边缘感兴趣，可以根据图像的噪声特性来选择滤波器的带宽，如果想要检测出现在不同分辨率下的边缘，就需要一种尺度空间上的方法。其中的一种方法通过模糊估计完成。

彩色边缘检测
彩色图像能够提供灰度图像无法提供的额外边缘信息，比如等亮度线（ios-luminant）

如果简单地结合每个通道上的灰度检测结果，带符号的梯度可能会相互抵消（比如一个由红到绿的边缘），如果将每个边缘的检测出的梯度联合起来，则会导致边缘加粗或者出现双倍边缘，难以连接

较好的方法是在每个颜色空间上计算有向能量（oriented energy）。

结合边缘特征线索
通过结合多个低级视觉线索，结合亮度梯度、颜色梯度、纹理梯度，可以得到较好的结果。

4.2.2 边缘连接

将鼓励的边缘连接成连续的轮廓

边缘的表示

链码（chain code）使用一个三位码对该点和下一个点之间的八个基本方向，表达紧凑但不利于进一步处理。
弧长参数化（arc length parameterization），使得匹配和处理更加容易。

4.2.3 应用：边缘编辑和增强

4.3 线条

检测直线

4.3.1 逐次近似

使用分段线性的折线或B样条曲线来近似曲线

4.3.2 Hough变换

哈夫变换（Hough transform），根据边缘来对可能的直线位置进行投票

基于RANSAC的直线检测

三种直线检测方法

逐次近似
哈夫
RANSAC

4.3.3 消失点

一些直线由于在三维中平行，它们拥有相同的消失点

4.3.4 应用：矩形检测

检测出相互成交的消失点后，就有可能搜索出矩形结构

第五章分割

图像分割的任务是寻找相互匹配的像素组，在统计学中，该问题称为聚类分析

5.1 活动轮廓

三种在图像中确定边界曲线的方法

蛇行（snake）
智能剪刀（intelligent scissor）
水平集方法

这三种都是活动轮廓（actve contour）的例子，它们在用户的约束下，迭代地移向其最终解

5.1.1 蛇行

5.1.2 动态蛇行和CONDENSATION

5.1.3 剪刀

根据用户的描画实时地更新轮廓

5.1.4 水平集

5.1.5 应用：轮廓跟踪和转描机

活动轮廓可以广泛应用于物体跟踪中
转描机（rotoscoping），用跟踪到的轮廓变化一组手画的动画形象

5.2 分裂与归并

对于灰度图像的一种简单的分割方法是：选择一个阈值然后计算连通分量，但因为光照和物体内部统计特性的变化，对于整张图片而言单一阈值是不够的。

5.2.1 分水岭

分水岭（watershed）是阈值化操作的一种，它将图像分割为若干集水盆地（catchment basin），计算方法是从所有的局部最小值处开始洪泛地形，并将演化出的不同部分交接的地方标记为脊。

5.2.2 区域分裂（区分式聚类）

5.2.3 区域归并（凝聚式聚类）

5.2.4 基于图的分割

利用区域间相对不相似性来确定那些区域需要合并的归并算法

5.2.5 概率聚集

5.3 均值移位和模态发现

均值移位和模态发现方法，例如k-均值和高斯混合，将与每个像素关联的特征向量（例如颜色和位置）模型化为来自某个未知概率密度函数的样本，而后师徒寻找在此分布中的群簇（模态）

5.3.1 k-均值和高斯混合

采用参数化形式为分割的概率密度函数建模

5.3.2 均值移位

均值移位用平滑的连续非参数化模型来模型化分布，其关键在于在高维数据分布中高效地寻找峰值，而不用显式地计算完整的函数

5.4 规范图割

规范图割检测邻近像素点之间的亲和度（affinity,相似度）并试图分开那些被弱亲和度连接起来的像素集。

5.5 图割和基于能量的方法

约束边界度量是在直接邻居之间而且通过在像素级求和来计算区域隶属统计量，用变分形式化或二值马尔科夫随机场将其形式化为一个经典的基于像素的能量函数
应用：医学图像分割

第六章基于特征的配准

6.1 基于2D和3D特征的配准

6.1.1 是呀最小二乘的2D配准

使用最小二乘法估计运动参数p

6.1.2 应用：全景图

6.1.3 迭代算法

非线性回归

6.1.4 鲁邦最小二乘和RANSAC

在对应点中有外点时，需要更鲁棒的最小二乘，在这种情况下，最好使用M-估计，它对残差施加一个鲁棒惩罚函数来代替它们的平方
M-估计可以减少外点的影响，但在一些情况中，从太多外点起步会导致算法无法收敛到全局最优化，更好的方法是寻找一个起步的对应的内点集合，也就是与主动运动估计一致的点。比如RANSAC和最小中位方差。