视觉图像二进制表示学习:方法、评估与应用
1. 二进制表示学习方法
1.1 最大内积搜索(MIPS)与二进制编码
在大规模相似性搜索问题中,使用最大内积搜索(MIPS)结合二进制编码技术,能在不损失太多信息的情况下,实现存储和计算效率的提升。可以定义函数 (p = \arg\max_{x\in X} q^T x) 进行高效计算。进一步,可将 MIPS 问题转化为形式化的 (l_2) 最近邻搜索问题,构建两组不同的哈希函数 (h(\cdot)) 和 (z(\cdot)) 来计算查询样本和数据库样本二进制码的内积,此时 MIPS 的目标函数可定义为 (p = \arg\max_{x\in X} h(q)^T z(x))。后续研究还将该学习方案融入到成对相似性保持哈希框架中,即 (|lS - h(Q)^T z(X)|_F^2),其中 (Q) 和 (X) 分别是所有查询样本和整个数据集样本。
1.2 顺序保持哈希(OPH)
顺序保持哈希(OPH)是一种在哈希码创建过程中保留数据点之间基于顺序关系的哈希技术。与传统哈希方法不同,OPH 强调在哈希码中保留原始数据点固有的顺序或层次结构。其基本概念是将相似的数据点映射到哈希码,使其在哈希空间中保持相对位置。具体而言,对于任意三元组样本 ((x_i, x_j, x_k)),若 (d(x_i, x_j) \leq d(x_i, x_k)),则在最优哈希函数 (H) 下,学习到的二进制码满足 (d(H(x_i), H(x_j)) \leq d(H(x_i), H(x_k)))。OPH 常用于需要保持数据点相对顺序的场景,如排名算法、推荐引擎等。
1.3 深度协作哈希
深度协作哈
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



