python—SIFT、Harris的简单实现与地理标记图像匹配

本文介绍了SIFT算法原理,包括尺度空间构建、极值点检测、特征点过滤,以及主方向计算和特征描述生成。通过Python的VLFeat库实现了SIFT特征匹配,并与Harris角点检测做了对比。最后讨论了地理标记图像的匹配过程,展示了成功匹配的示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、SIFT算法原理

这里关于SIFT算法的描述是我参考网上的资料提了一些加上自己的理解来作为大概的描述,若是想更具体地了解SIFT的相关原理可以参考以下网址:https://www.cnblogs.com/wangguchangqing/p/4853263.html

1.概述

SIFT算法的主要思想是在尺度空间寻找极值点,然后对极值点进行过滤,找出稳定的特征点,最后在每个稳定的特征点周围提取图像的局部特性,形成局部描述子并将其用在以后的匹配中。SIFT 算法有以下几个主要步骤:
(1)尺度空间的极值检测。
(2)特征点定位。
(3)特征方向赋值。
(4)特征点描述。

2.构建尺度空间

尺度空间的主要思想是对原始图像进行尺度变换,并满足特征点的尺度不变性。
搜索所有尺度空间上的图像,通过高斯微分函数来识别潜在的对尺度和选择不变的兴趣点。学过数字图像处理应该知道,通过将图像与高斯函数做卷积运算能够对图像做相应程度的模糊,高斯卷积核是实现尺度变换的唯一线性核,所以一幅二维图像的尺度空间可定义为函数L(x,y,σ),其中G(x,y,σ)为尺度可变高斯函数:
在这里插入图片描述
其中(x,y)为图像点的像素坐标,I(x,y)为该点数据。σ是高斯正态分布的方差,称为尺度空间因子,其反映了图像被平滑的程度,其值越小表征图像被平滑程度越小,相应尺度越小,通俗点说,方差越小,图像越清晰,细节部分便比较清楚,方差越大,则图像越模糊,体现的图像轮廓比较清楚。
为了有效地检测图像中一定尺度空间的稳定关键点,提出了利用尺度空间中DoG(Difference-of-Gaussian)极值作为判断依据,表达式为D(x,y,σ),DoG算子定义为两个不同尺度的高斯核的差分,简单点理解就是将尺度空间看为一层一层的平面,相邻两层之间有一定的距离,这些距离便是差分,根据下面的构造图会更好地理解。设 k 为两相邻尺度空间的比例因子,则DoG算子定义如下:
在这里插入图片描述
D(x,y,σ)构造方式如下图所示:
在这里插入图片描述
3.检测DoG尺度空间极值点

极值点,顾名思义就是在一定的范围内最大或者最小的点,为了寻找尺度空间的极值点,每个像素点要和其同一尺度空间和相邻的尺度空间的所有相邻点进行比较,即和当前所在的那一层和相邻的两层上面的像素点做比较,当某一点大于或者小于所有相邻点时,该点就是极值点。
如下图所示,中间的检测点要和其所在图像的3×3邻域8个像素点,以及其相邻的上下两层的3×3领域18个像素点,共26个像素点进行比较,以确保在尺度空间和二维图像空间都能检测到局部极值。图中用红色圈出标记为叉号的像素若比相邻26个像素的DoG值都大或都小,则该点将作为一个局部极值点,记下它的位置和对应尺度。
在这里插入图片描述
4.删除不好的极值点

在上一步中算法搜索出了尺度空间的极值点,但并不是所有的极值点都可以作为合适的关键点,因为通过比较检测得到的DoG的局部极值点是在离散的空间搜索得到的,由于离散空间是对连续空间采样得到的结果,因此在离散空间找到的极值点不一定是真正意义上的极值点,因此要设法将不满足条件的点剔除掉。那么以下两种方法便是针对局部、尺度和主曲率比率与邻近像素进行详细比对,去除低对比度(敏感噪声)的关键点或不稳定的局部边缘响应点。

(1)剔除低对比度的特征点

设候选特征点为 x,其偏移量定义为 Δx,其对比度为D(x)的绝对值∣D(x)∣,对D(x)应用泰勒展开式:
在这里插入图片描述
由于x是D(x)的极值点,所以对上式求导并令其为0,得到:

使用包,python源码实现SIFT 尺度不变特征转换(Scale-invariant feature transform或SIFT)是一种电脑视觉的算法用来侦测描述影像中的局部性特征,它在空间尺度中寻找极点,并提取出其位置、尺度、旋转不变量,此算法由 David Lowe在1999年所发表,2004年完善总结。 其应用范围包含物体辨识、机器人地图感知导航、影像缝合、3D模型建立、手势辨识、影像追踪和动作比对。 此算法有其专利,专利拥有者为英属哥伦比亚大学。 局部影像特征的描述侦测可以帮助辨识物体,SIFT 特征是基于物体上的一些局部外观的兴趣点而影像的大小和旋转无关。对于光线、噪声、些微视角改变的容忍度也相当高。基于这些特性,它们是高度显著而且相对容易撷取,在母数庞大的特征数据库中,很容易辨识物体而且鲜有误认。使用 SIFT特征描述对于部分物体遮蔽的侦测率也相当高,甚至只需要3个以上的SIFT物体特征就足以计算出位置方位。在现今的电脑硬件速度下和小型的特征数据库条件下,辨识速度可接近即时运算。SIFT特征的信息量大,适合在海量数据库中快速准确匹配。 SIFT算法的特点有: 1. SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性; 2. 独特性(Distinctiveness)好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配; 3. 多量性,即使少数的几个物体也可以产生大量的SIFT特征向量; 4. 高速性,经优化的SIFT匹配算法甚至可以达到实时的要; 5. 可扩展性,可以很方便的其他形式的特征向量进行联合。 SIFT算法可以解决的问题: 目标的自身状态、场景所处的环境和成像器材的成像特性等因素影响图像配准/目标识别跟踪的性能。而SIFT算法在一定程度上可解决: 1. 目标的旋转、缩放、平移(RST) 2. 图像仿射/投影变换(视点viewpoint) 3. 光照影响(illumination) 4. 目标遮挡(occlusion) 5. 杂物场景(clutter) 6. 噪声 SIFT算法的实质是在不同的尺度空间上查找关键点(特征点),并计算出关键点的方向。SIFT所查找到的关键点是一些十分突出,不会因光照,仿射变换和噪音等因素而变化的点,如角点、边缘点、暗区的亮点及亮区的暗点等。 Lowe将SIFT算法分解为如下四步: 1. 尺度空间极检测:搜索所有尺度上的图像位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。 2. 关键点定位:在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于它们的稳定程度。 3. 方向确定:基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换,从而提供对于这些变换的不变性。 4. 关键点描述:在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形和光照变化。 本文沿着Lowe的步骤,参考Rob Hess及Andrea Vedaldi源码,详解SIFT算法的实现过程。 未使用包,python源码实现
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值