论文翻译：Practical and Efficient Multi-View Matching

最新推荐文章于 2023-03-19 02:49:13 发布

原创最新推荐文章于 2023-03-19 02:49:13 发布 · 715 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#多视角匹配

多视角匹配专栏收录该内容

4 篇文章

订阅专栏

本文提出一种名为MATCHEIG的多视图匹配方法，基于频谱分解，能有效提高匹配准确性并减少计算时间。该方法通过计算包含两两对应的块矩阵的顶点特征向量，再将特征向量投影到排列上产生输出成对匹配。

来源：ICCV2017

Abstract

在本文中，我们提出了一个多视图匹配问题的新颖解决方案，即给定一组噪声成对的对应关系，联合更新它们以最大化它们的一致性。我们的方法基于频谱分解，与文献中可以找到的其他迭代技术相比是一种闭式的高效算法。在合成和实际数据集上的实验都表明，我们的方法在明显更少的时间内达到与最先进算法相当或更高的精度。我们还证明，我们的解决方案可以有效地处理数百个图像的数据集，这在文献中是前所未有的。

1. Introduction

建立特征集之间的对应关系是计算机视觉中的一个基本问题，它是任何几何计算（例如运动结构）的基础，也是对象识别和形状分析的基础。在本文中，我们考虑从图像集合中提取特征的情况。

该研究方向的大部分工作集中于寻找两个特征集之间的对应关系[14,11,13,12,15,20]。但是，在许多任务中，通常需要在多个视图中查找匹配。此外，最近的研究表明，与单独的视图对之间计算匹配相比，联合优化整个数据集中的对应关系可以带来显着的改进，因为成对匹配算法会产生噪声和不可靠的结果。

事实上，外观和几何本身并不能保证匹配的正确性，因此，所有人都可以做到的是采用跨越多个视图的匹配闭环一致性产生的更高层次的约束。这被一些作者称为联合匹配或多视图匹配。

联合匹配的一种自然方法是直接在特征空间中操作，即优化明确依赖于在所有图像中提取的特征的代价函数。这种类型的早期解决方案包括[21,22,16,25]中提出的方法。最近，[6]的作者对图像索引问题进行了多视图匹配，而[3]采用了博弈论的方法，匹配问题被表示为非合作博弈。在文献[18]中引入了等级约束条件来实现视频帧点匹配，并且这种方法在[30,8]中得到了扩展，其中联合匹配问题被鲁棒地表述为低秩和稀疏矩阵分解。
在[19,7,2,31,28]中采用了不同的方法，其中多视图匹配分两步解决：首先，孤立地执行图像对之间的匹配;那么这种对应关系通过全局优化其内在连贯性而得到改善，而不依赖于特征的实际价值。在本文中，我们将重点放在这些方法上，因为它们比基于特征的方法更快，内存要求更少。
在这种情况下，一个关键的概念就是循环一致性，即沿着任何循环的成对匹配的组成应该给予身份。这个属性在几个算法中被利用来去除成对对应中的异常值[29,17,9]。然而，实际上，由于噪声，可能会发现少数一致的周期，并且考虑到所有的周期在计算上是棘手的。最近的一些研究[19,7,31]表明，如果所有的成对对应都是在一个块矩阵中进行收集，那么循环一致性可以降低到要求这个矩阵是正半定和低秩。文献[19]的作者将多视点匹配表示为同步问题，通过频谱分解近似求解。在文献[7]中提出了一种基于半定规划的解决方案，但是假定所有图像之间的特征对应性都是一致的。为了处理部分对应关系，这种技术在[2]中得到了扩展，并且假定有一定的噪声模型，在存在损坏的输入的情况下提供了精确匹配的理论保证。在[31]中，将联合匹配问题表示为低秩矩阵恢复任务，采用秩最小化的核范数松弛。最终的成本函数通过交替方向乘法器（ADMM）进行优化。最后，文献[28]提供了基于近代高斯 - 赛德尔方法的解决方案，如[7]所示，所有图像之间的对应关系是完全对应的，因此限制了其适用于真实场景。
在本文中，我们提出了一种新颖的多视点匹配封闭形式，称为MATCHEIG，其过程如下：首先计算包含两两对应的块矩阵的顶点特征向量，然后，将特征向量投影到排列上以产生输出成对匹配。由此产生的方法是非常简单的，它可以在几行Matlab编码。它的准确度与现有技术相当或优于现有技术，如合成和真实实验所示，其速度明显快于所有竞争方法。由于其计算效率，它成功处理了数百个图像的集合，其他人无法生成解决方案。
所提出的方法与[19]具有相同的框架，因为它基于谱分解。关于[19]的区别在第二节详细描述。 3，并且它们意味着性能的显着改善，如实验所证明的。
本文的结构如下。第二部分正式定义了这个问题，第三部分对所提出的方法进行了描述。第四部分对合成和实际数据进行了实验并分析了结果。最后，第五部分得出结论。