深度协作图哈希:原理、训练与实验分析
1. 深度协作图哈希概述
深度协作图哈希将视觉特征提取、语义编码以及重建图二进制码学习整合到一个统一的学习框架中。其目标函数可表示为:
$R = R_1 + \alpha R_2 + \beta (R_3 + R_4)$ (6.8)
在该方法中,潜在视觉语义、重构语义和交互结构语义能同时保存在优化后的哈希码中,用于大规模图像检索。同时采用分段分类、成对逼近和重构语义等交互和多级学习范式。
2. 训练策略
最终目标函数 (6.8) 包含三个整体编码网络:
- 视觉表示学习网络 $R_1$
- 语义二进制编码网络 $R_2$
- 由 $(R_3 + R_4)$ 组成的潜在图二进制嵌入网络
具体优化过程采用迭代学习方式,即 $R_1 \to R_1 \to {R_3 + R_4}$,涉及二进制码 $B^ $($ = v, l, g$)和网络参数 $\theta^ $($ = v, l, e, d, g$)。训练过程中,最终的 $B$ 设置为 $B = sgn(H_v + \alpha H_l + \beta H_g)$,每个编码网络分支只有一个最优二进制表示 $B$。主要优化过程包括网络参数更新和二进制码学习。
2.1 网络参数更新
对于网络参数 $\theta^*$,采用交替优化策略,即固定其他参数时更新一个参数。具体使用基于 PyTorch 的随机梯度下降(SGD)和反向传播(BP)算法进行网络自动优化。
2.2 二进制码学习
由于具有离散约
深度协作图哈希在图像检索中的应用
超级会员免费看
订阅专栏 解锁全文
120

被折叠的 条评论
为什么被折叠?



