一篇用于相似物品的图片推荐的paper,github地址
网络结构如下所示
图a展示的是整体的框架,每个VisNet具体细节如图b所示。
VisNet是具有两个分支:一个传统 的VGG16和一个浅层网络(kernel size 较大)
VGG16用于提取 high level/ abstract details
浅层网络用于提取 low level/fine-graind details
triplet loss也用于此。
(q,p,n)
a query image (q), a positive image (p) and a negative image (n)
The in-class triplets 让网络学会细微的差异,The out-of-class triplets让网络学会coarse-grained 差别。
测试的时候,是对每张图片直接提取图b中最后输出的feature vector,之后再用距离度量方式度量差异性。
本文介绍了一种基于深度学习的相似图片推荐系统。该系统利用包含两个分支的VisNet网络(传统VGG16和浅层网络)提取图片特征,并通过三元组损失函数训练网络学习细微及粗粒度差异。

被折叠的 条评论
为什么被折叠?



