HPatches数据集完整使用指南
HPatches(Homography-patches)数据集是计算机视觉领域用于评估手工制作和学习型局部描述符性能的重要基准工具。该数据集在CVPR 2017会议上首次发布,并在ECCV 2016的局部特征研讨会中作为本地描述符评估挑战的基础。
数据集快速获取
自动下载方案
推荐使用配套的基准工具箱,该工具箱提供了自动化脚本,可以自动下载所有需要的数据集文件,这是进行描述符评估的推荐方式。
手动下载方法
如果需要手动获取HPatches数据集,可以下载并解压以下文件:
- HPatches数据集 [4.2GB]
数据集结构详解
HPatches数据集包含从多个图像序列中提取的补丁,每个序列包含相同场景的图像。序列根据图像之间的变换类型进行组织:
i_X:从具有光照变化的图像序列中提取的补丁v_X:从具有视角变化的图像序列中提取的补丁
对于每个图像序列,我们提供从参考图像中提取的一组参考补丁ref.png。对于序列中的所有其他图像,我们提供另外两个文件eX.png和hX.png,包含在其他图像中找到的"相同"(对应)补丁。
示例图像序列。最左边的图像是参考图像,后面是5个不同视角的图像。
补丁提取方法
每个图像序列包含一个参考图像和5个目标图像,这些图像在不同的光照条件和/或平面场景的不同视角下拍摄。对于所有图像,我们都有相对于参考图像的估计地面真实单应性矩阵H。
补丁在参考图像中使用局部特征提取器(Hessian、Harris和DoG检测器)的组合进行采样。使用Lowe的方法通过单个主要方向估计补丁方向。不使用仿射适配,因此所有补丁在参考图像中都是方形区域。
从区域中提取补丁时,其尺度相比原始检测到的特征尺度放大了5倍。仅保留该区域完全包含在图像中的补丁。
参考图像中的示例检测结果。补丁位置可视化为椭圆。检测到的补丁(橙色)的尺度放大5倍以获得补丁测量区域(黄色)。
为了从目标图像中提取补丁,首先应用仿射抖动。仿射抖动的目标是模拟典型局部特征检测器的几何可重复性误差。对于简单抖动,与原始补丁的中值椭圆重叠约为0.85,对于困难抖动约为0.72。抖动后,使用地面真实单应性将帧重新投影到目标图像。
完整图像序列
除了提取的基于补丁的数据集外,我们还提供了使用的完整图像序列以及相应的单应性矩阵。
- HPatches完整序列 [1.3GB]
核心技术特点
补丁规格
每个补丁的大小为65x65像素,单个*.png文件包含从图像中提取的所有补丁,沿着单列堆叠。
几何噪声模拟
为了模拟常见补丁检测器的局限性,通过添加一定量的几何噪声(仿射抖动)来提取对应关系。特别是,e(简单)补丁具有较小的几何噪声,而h(困难)补丁具有更多的几何噪声。
应用领域
HPatches数据集广泛应用于:
- 局部描述符性能评估
- 新算法验证和比较
- 计算机视觉研究
- 机器学习模型训练
引用说明
如果使用HPatches进行研究,请引用相关来源。有关从本数据集中未最初引入的序列中提取的补丁的相关引用信息,请查看references.txt文件。
HPatches数据集为计算机视觉研究社区提供了一个标准化、全面的评估平台,推动了局部描述符技术的持续发展和创新。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考







