语义感知对抗训练:优化深度哈希模型的新框架
1. 引言
在深度哈希领域,对抗学习对于提升模型的鲁棒性至关重要。然而,深度哈希缺乏有效的判别性代表来指导对抗攻击和防御。为了解决这一问题,提出了语义感知对抗训练(SAAT)框架,旨在通过精心设计的全局最优语义代表,将深度哈希的对抗训练形式化为统一的极小极大范式,以优化可靠的深度哈希模型。
2. 预备知识
2.1 基于深度哈希的检索
考虑从训练集 $O = {(x_i, y_i)} {i=1}^N$ 中学习哈希模型 $F$,其中 $x_i$ 表示第 $i$ 张图像,$y_i = [y {i1}, y_{i2}, \cdots, y_{iC}] \in {0, 1}^C$ 是 $x_i$ 的标签向量,$y_{ij} = 1$ 表示 $x_i$ 属于第 $j$ 类,允许 $x_i$ 属于多个类(多标签数据)。
哈希模型 $F$ 的目标是为训练集获取一组 $K$ 位二进制码 $B = {b_i} {i=1}^N \in {-1, 1}^{N\times K}$,以在汉明空间中保留样本之间的语义相似性,便于高效的近似最近邻搜索。通常,使用相似性矩阵 $S$ 来表示每对样本之间的语义相似性,对于任意两个实例 $x_i$ 和 $x_j$,$S {ij} > 0$ 表示它们至少共享一个类,否则 $S_{ij} = 0$。
哈希码 $b_i$ 的生成过程可以表示为:
$b_i = F(x_i) = \text{sign}(f_{\theta}(x_i)), \text{s.t. } b_i \in {-1, 1}^K$
超级会员免费看
订阅专栏 解锁全文
2297

被折叠的 条评论
为什么被折叠?



