图像检索中的哈希算法:Scalable Supervised Asymmetric Hashing 与相关技术
1. 哈希算法概述
在处理海量视觉数据时,紧凑哈希码正逐渐成为一种有效的解决方案。哈希,即二进制表示学习技术,在众多实际应用中引起了广泛关注,例如相似性搜索、目标识别和图像聚类等。近年来的研究表明,哈希是大规模图像检索任务中进行最近邻搜索的可行方法。
目前,哈希方法大致可分为两类:数据无关和数据相关。数据无关的哈希方法常常存在信息丢失和编码冗余的问题,因此通常需要更长的哈希码或多个哈希表来提高检索性能。为了解决这些挑战,大量研究集中在数据相关的哈希方法上,也就是所谓的“学习哈希”。这些方法利用数据的固有结构来设计哈希函数,能够以相对较短的二进制码长度实现更好的性能。
现有的基于哈希的方法一般可分为两类:几何保持方法和语义保持方法。几何保持方法通常属于无监督哈希,侧重于学习能够保持数据样本之间几何相似性的紧凑二进制码。相比之下,语义保持哈希方法利用有监督的语义信息来开发哈希函数。由于包含了语义标签信息,有监督哈希在许多应用中表现优于无监督方法,这也促使人们对各种有监督学习技术进行了大量探索。然而,语义保持哈希方法也面临着一些挑战,如耗时的离散优化和处理大规模数据时的可扩展性有限。
当前的有监督哈希方法在高效的大规模图像检索任务中缺乏灵活性和适应性。具体问题包括:
- 许多方法忽视了保持成对相似性以及从语义标签中有效学习哈希码的重要性,只利用了部分可用的语义数据。
- 对学习到的哈希码施加离散约束会使问题转化为一个NP难的混合整数优化问题。将其简化为连续问题往往会导致检索性能下降。
- 该领域中普遍存在的迭代离散优化算法在处
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



