论文-Deep Cross-Modal Hashing

本文提出了一种名为DeepCross-ModalHashing (DCMH) 的方法,它首次实现了特征学习与哈希码学习在同一框架内的整合。DCMH利用两个深度神经网络分别提取图像和文本特征,并通过一种交叉学习策略来优化网络参数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Deep Cross-Modal Hashing

 

 关键词:cross-Modal, deep learning 

 

因为cross-modal hashing的低存储和高效的查询能力,被广泛用于多媒体的相似度检索中。本论文提出了一个deep cross-modal hashing(DCMH),首次将feature learning和hash-code learning结合到同一个框架中。

 

DCMH的框架:

 

该框架包含两个deep Neural Network,一个是提取image的feature,另一个提取text中的feature。

 

CNN的结构为:

其中包含五个conv layer和三个fc layer,LRN表示加入了Local Response Normalization,

 

BoW的结构为:

 

 

根据上面的feature learning得到hash code,

其中DCMH的objective function是

 

最后多次实验,发现如果两个模态同一个类的训练样本的binary code设置为一致,会取得更好的效果。

 

 

learning method

采取了一种交叉学习的策略,同时对 X, Y 和B进行学习。保持X与Y的网络对B进行training,然后保持B的参数不变而对X与Y的网络进行training。

 

当固定Y网络和B时,对X网络进行优化:

 

当固定X网络和B时,对y网络进行优化:

 

当固定X,Y网络和时,对B进行优化:

 

 

实验效果:

 

 

 

个人感受:

用deep learning工具加入cross-modal这个领域,且第一次完成了end-to-end的框架的设计。

 

转载于:https://www.cnblogs.com/zhang-yd/p/7799912.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值