Spatial-Aware Feature Aggregation for Cross-View Image based Geo-Localization
-
Spatial-Aware Feature Aggregation for Cross-View Image based Geo-Localization
-
时间
- 2019
-
作者
- Shi Yujiao
-
motivation
-
现在的卷积神经网络,通常将这种问题视作一种metric embedding task,现在由于low recall rates低召回率,表现得并不良好
-
原因如下
- 巨大的域差异,包括外观visual appearance 以及几何配置geometric difference,而这些都是被现在的方法忽视的,现在的方法就只是暴力训练,然后表现较差
-
-
idea
-
研究了一个,着重观察这些被无视的天生的inherent differences的特点
-
作者观察到,就是位于空域图像上的同一方向角的像素点,一般都位于对应的地域的图像的垂直方向上
-
提出了一个两阶段的方法
-
应用一个regular polar transform 常规的极坐标转化
- 这是一个 pure geometric transformation纯粹的几何变换,跟场景的内容无关,所以必然不可能把两个空域对齐 alignment
-
-
-

该研究针对跨视角图像地理定位的挑战,提出了一种新的方法。现有的卷积神经网络在处理此类任务时因低召回率而表现不佳,主要原因是忽略了图像间的外观和几何差异。作者引入了极坐标转换和自注意力机制,以减少不同视角图像之间的域差异。通过学习多个空间嵌入的特征聚合策略,提高了特征表示的鲁棒性。实验表明,这种方法能实现更精确的定位,显著提升了精度。相关工作包括VLAD描述符和特征传输模块,但本文的方法通过结合几何变换和注意力机制,更好地捕捉了图像间的关系。
最低0.47元/天 解锁文章
1967

被折叠的 条评论
为什么被折叠?



