一、引
这篇文章提出一种可扩展的因子分解模型,这种模型可以将视觉信号融入到预测器中。该文利用深层网络(CNN)从产品图像中提取视觉特征,进而从中挖掘人们的反馈。这种做法不仅可以使得模型更准确,而且可以缓解冷启动的问题。
二、已有模型——MF(矩阵分解)
1.以下是基本预测公式:
2.符号说明:
3. 存在的问题:
由于真实世界的数据集的稀疏性,他们仍然面临着冷启动的问题。
4.解决思路:
将评级维度划分为视觉因素和潜在(非视觉)因素。使用显式特征缓解该问题。
三、VBPR:视觉贝叶斯个性化排名
1.图片特征通过CNN进行提取,将图片特征与潜在的特征联合在一起进行推荐。如下图所示:
2.偏好预测器模型:
①模型:
②符号说明:
3. 模型实现:
学习一个嵌入内核,将高维特征线性转换为一个更低维的(比如20个左右)“视觉评级空间”
①嵌入内核公式:
②符号说明:
③评价:
这种嵌入是有效的,因为所有的项目都共享相同的嵌入矩阵,这显著减少了需要学习的参数的数量
5.VBPR模型公式:
①公式:
②说明:
β':视觉偏差,与fi的内积相当于用户对一个给定项目的视觉外观的整体看法。
四、使用BPR进行模型学习
贝叶斯个性化排序(BPR)是一种采用随机梯度上升作为训练过程的成对排序优化框架。
1.个性化排序(BPR-OPT)
2. 当使用矩阵分解作为偏好预测器时(BPR-MF),
定义为
3.学习BPR-MF(更新参数)的方法
η:是学习速率
五、更新参数的方法
1.非视觉参数:
以与BPR-MF相同的形式更新
2.视觉参数
5.实验:
1.数据集:Amazon.com、Tradesy.com
预处理后的数据集统计信息
2.基线:
Random (RAND) |
这个基线会对所有用户的项目进行随机排序。 |
Most Popular (MP) |
这个基线根据项目的受欢迎程度对项目进行排序,并且是非个性化的 |
MM-MF |
两两MF模型,该模型对xuij上的铰链排名损失进行了优化,并像在BPR-MF中一样使用SGA进行训练。 |
BPR-MF |
隐式反馈数据集的个性化排名 |
Image-based Recommendation (IBR)(基于图像的推荐服务) |
它学习了一个视觉空间,并检索与查询图像风格相似的项目。然后在学习到的视觉空间中通过最近邻搜索来进行预测。 |
3.实验结果及结论
①
不同数据集的平均AUC结果(共有20个因子)
结论 :
VBPR在大多数情况下都优于所有基线。
在BPR-MF的基础上,VBPR对所有项目的BPR-MF平均提高超过12%,对冷启动提高超过28%。将CNN功能纳入我们的排名任务具有显著好处。
②敏感性
不同维度下的AUC
结论:
随着因子数量的增加,MM-MF、BPR-MF和VBPR表现得更好,这说明了两两方法避免过拟合的能力。
③培训效率
不断增加训练迭代的AUC(在测试集上)
结论:
我们提出的模型比MM-MF和BPR-MF需要更长的收敛时间,尽管仍然只需要大约3.5个小时的训练才能在我们最大的数据集(女装)上收敛。