归纳结构一致哈希:高效图像检索新方法
1. 引言
在大规模相似性搜索场景中,学习紧凑且有意义的数据表示对于实际应用至关重要。哈希技术,即二进制表示学习,因其在处理大量数据时具有低内存和低计算需求的独特优势而备受关注。创建简洁的哈希码是提高搜索速度并保持检索质量的关键。
基于学习的哈希方法在快速图像检索方面表现出色,优于传统的无学习(或与数据无关)的哈希技术。基于学习的哈希核心原理是通过汉明排名或查找表来实现高效的最近邻搜索。根据标签可用性,这些方法大致可分为无监督和有监督(或半监督)两类:
- 无监督哈希 :专注于创建保持未标记数据点的度量距离、分布或拓扑特征的哈希函数,但往往忽略了类别标签中的关键信息。
- 有监督哈希 :旨在学习保留语义信息的哈希码,通过利用类别标签中的判别性语义,通常能显著提高性能。
深度学习革命推动了基于深度学习的哈希研究的兴起。然而,大多数深度哈希方法先学习连续特征,再进行二值化,这种连续松弛方法在优化过程中难以产生真正紧凑的二进制代码,且模型复杂,不适合实时应用。
语义保留哈希的关键在于将对象从视觉特征空间和二进制类空间映射到离散的汉明空间,但有效弥合视觉、语义和哈希空间之间的三边域差距是一个重大挑战。传统检索模型在利用类别信息和三边域语义连接方面存在不足,且离散优化二进制代码的方法效率低下。
为解决这些问题,引入了归纳结构一致哈希(ISCH)框架,其核心是建立一个中间语义空间,以弥合视觉空间、原始类标签空间和汉明空间之间的差距。该框架的主要贡献如下:
1. 促进灵活语义知识在视觉、语义和离散汉明三个不同域之
归纳结构一致哈希:图像检索新突破
超级会员免费看
订阅专栏 解锁全文
1959

被折叠的 条评论
为什么被折叠?



