SuperGlue: Learning Feature Matching with Graph Neural Networks 论文解析

最新推荐文章于 2025-01-19 20:45:55 发布

原创

最新推荐文章于 2025-01-19 20:45:55 发布 · 3.8k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#计算机视觉 #算法 #深度学习 #特征点 #SLAM

SuperGlue是一种基于图神经网络的特征匹配算法，通过学习特征点的位置信息及相互关联来提升匹配性能。该文介绍SuperGlue的工作原理，包括图卷积神经网络、注意力机制及Sinkhorn算法的应用。

SuperGlue: Learning Feature Matching with Graph Neural Networks 论文解析

简介

出发点

快速最临近邻搜索（FLANN）算法常常被用于匹配得到最近邻特征点，从而得到图片A和图片B中的特征点的匹配对。但是本文认为，特征点的提取与描述采用复杂的深度学习算法后不再是限制因素，而Naive的匹配方法才是限制其性能的关键点。因此本文在SuperPoint的基础上提出了一种匹配算法，取得了匹配性能的极大改进。

相关工作

经典的局部特征匹配流程
- 提取特征点
- 计算视觉描述子
- 最近邻搜索匹配
- 滤除不正确的匹配关系（Lowe’s radio test）
- 计算图片间的几何关系（RANSAC）
基于深度学习的匹配
- 改进特征点提取方法
- 改进描述符计算方法
- 依旧采用传统的最近邻搜索方法
图搜索

图匹配是一个NP-难的问题，其中和特征点匹配等价的问题为最优搬运问题。该问题可采用Sinkhorn算法进行求解。

集合深度学习

难点：特征点的数量和彼此之间的相关关系都是不确定的，难以用传统的卷积方法进行深度学习。

具体的也是参考了一些相关文献，找到了适用于本任务的学习方法

TODO
- [3] [13] [21] [23] [25] [30] [37] [38] [54] [55] [56] [58] [60] [62] [64]

因此，本文的创新点在于：

采用深度学习方法，替换掉传统的最近邻搜索与不正确匹配关系剔除两个步骤
采用基于注意力机制的图卷积神经网络提取特征信息
采用可微分的分配算法，即Sinkhorn算法，得到匹配结果

方法

理解本文需要有如下的基础知识：

图卷积神经网络
注意力机制
最优搬运问题

图卷积神经网络

图卷积神经网络是目前很火的内容，为了理解本文，需要有如下的相关知识，即网络的计算方式。

在这里插入图片描述

图网络分为很多层，和普通卷积网络类似
图网络每一层中有节点和边，节点和边的连接关系不规则
定义卷积操作，即下一层节点的值，为上一层节点连接的所有节点的函数。
$x_i^{n+1} = f(x_1^n,x_2^n,x_3^n,\cdots,x_m^n),x_{1\to m}为所有与i节点关联的节点$
- 例如： $x_1^2$ 为第二层第一个节点与 $x_2,x_3$ 节点相连，因此计算为：
  $x_1^2 = f(x_1^1,x_3^1,x_4^1)$
通过定义不同的卷积方法 $f$ ,得到不同类型的图卷积网络，文中借鉴注意力机制定义了卷积方法。

注意力机制

文中通过注意力机制构建了卷积计算方法，所谓的注意力机制即计算如下的权重，然后进行加权求和。
简化版本为：
$A=\alpha_1 x_1 + \alpha_2 x_2 + \cdots + \alpha_m x_m$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。