Deep Supervised Hashing for Fast Image Retrieval

这篇论文提出了一种名为Deep Supervised Hashing (DSH)的方法,使用深度CNN模型学习二进制编码,优化损失函数以最大化图像对的区别,并在离散输出上添加正则项。DSH在CIFAR-10和NUS-WIDE数据集上展示了出色的表现,解决了传统方法中非线性激活函数导致的计算复杂性和训练难题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

这篇paper中提出了Deep Supervised Hashing (DSH)来进行binary code的学习。主要特点如下:(1)设计了深度CNN模型,training data的输入为图像对(imilar/dissimilar),输出为每幅图像的hash code;(2)loss function 最大化了图像之间的区别,区别是从输入图像编码而成的编码空间;(3)在离散化真实值的输出上加了正则项;(4)对于查询的图像通过模型编码成hash code,并通过binary code 表示图像特征。通过在CIFAR-10 和NUS-WIDE上与state-of-the-arts 相比,DSH实验效果promising performance。

主要工作和解决的问题

DSH采用一种CNN架构,输入为图像对(无论两个图像是否相似),输出为binary code。具体架构如下。在实际过程中, 采用在线生成图像对(generate image pairs online)以至于在训练阶段有更多的图像对进行训练。loss function将相似图像在编码空间上拉近距离,将不相似的图像在编码空间上推远距离。为了避免在loss function在hamming空间上不可微分,输出的值松弛化到真实值,同时在离散化的真实值的输出上加了正则项。

主要解决的问题在之前模型中非线性的激活函数在生成hash code中需要很大的计算代价,降低了网络的训练。文章主要对损失函数进行了优化推导。

DSH模型

DSH模型学习图像特征的compact binary codes,主要优点在于:(1)相似的图像在hamming空间上编码相似;(2)binary code计算更加高效。

Loss

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值