Deep Hashing Network for Efficient Similarity Retrieval

最新推荐文章于 2022-05-19 13:14:28 发布

原创

最新推荐文章于 2022-05-19 13:14:28 发布 · 4.6k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#hash #网络 #二进制

本文介绍了一种深度哈希网络（DHN），它通过改进传统的监督哈希方法，利用CNN学习图像特征并直接生成二进制码，减少量化误差。DHN在NUS-WIDE、CIFAR-10和Flickr数据集上的实验表明其在相似性检索任务上的优势。

Deep Hashing Network for Efficient Similarity Retrieval

Introduce

这是发表在AAAI-2016的一篇paper，下载地址
在本篇论文之前的监督Hash方法，第一步通过手动学习或者机器学习得到特征向量，第二步学习二进制的Hash Code。然而，这种方法存在明显的缺点，首先提取的特征并不一定完善，并且学习的二进制的Hash Code也有量化的误差。所以作者提出了Deep Hashing Network(DHN)。DHN模型主要从以下四个部分对之前的方法进行改进：

使用CNN来学习图像的特征。
使用CNN的全连接层来生成二进制码。
减少交叉熵损失，使原始空间相似的图片在海明空间也相似。
减少量化误差提高Hash Code的质量。
在下面详细介绍一下改进过程：

Deep Hashing Network

相似性检索中，给定训练集N个points $\{x_i\}_{i=1}^N$ ，每一个是一个D维的特征向量， $x\in R^D$ 。每一对特征向量之间有一个相似性的label $s_{ij}$ ，如果 $x_i$ 和 $x_j$ 相似， $s_{ij}=1$ ；如果 $x_i$ 和 $x_j$ 不相似， $s_{ij}=0$ 。我们的目标就是学习到非线性的hashing function $f:x \mapsto h\in \{-1,1\}^K \quad h=f(x)$ 。
在本篇论文中，作者提出了如下图所示的网络结构，网络的输入是一组 $\{x_i,x_j,s_{ij}\}$ 三元组。
图1 网络结构
figure1 显示的图片是AlexNet的修改，原始AlexNet网络结构con1-con5是5个卷积层，fc6-fc8是三个全连接层。对于每一个全连接层l总会学习到一个非线性的mapping。