文献阅读 BPR: Bayesian Personalized Ranking from Implicit Feedback

本文介绍UAI2009收录的经典论文BPR-OPT,一种基于贝叶斯理论的个性化排名方法,用于优化推荐系统中的物品排名。文章详细阐述了BPR-OPT的推导过程及如何利用显式反馈进行训练。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文介绍

这篇论文被UAI 2009收录,这篇论文在推荐系统领域中非常经典,就算十年后的今天仍然能在不少论文中看到BPR的身影。

简介和相关工作

推荐系统的任务是给用户推荐一系列个性化的物品,之前人们从显式反馈中做推荐的主要方法为矩阵分解(MF)和适应性K最近邻(KNN)。但是这些方法都不是对物品排名做直接的优化。于是这篇文章提出了一种个性化排名的方法BPR-OPT,这种方法是基于贝叶斯理论的极大化后验概率。用户的显式反馈一般从用户与系统的交互行为中得出,比如用户的购买历史,观看历史等,这些很容易从后台日志中得到。

论文核心

U:表示用户集合
I:表示项目集合
那么

表示所有的显式反馈,如图所示:
在这里插入图片描述
本文定义了一种偏序关系>u,并且这种偏序关系具有三种特征:完整性,反对称性,传递性。这样可以根据上图的用户物品显性反馈矩阵,得到所有用户的偏序矩阵。如下图所示:
在这里插入图片描述
其中,?表示无显性打分数据,+表示用户比j偏爱i,-则相反。
如果用户对查看了物品i2,但是没有查看项目i1,那么可以确定用户对于i1,更偏爱i2。但是如果用户同时查看了i1和i2或者同时都没有查看,那么就是无法确定是否i1和i2的偏序关系。该篇论文的训练集为Ds:
在这里插入图片描述Ds是一个三元组(u,x,j)的集合。下面我们看看BPR-Optimization Criterion的推导公式:
在这里插入图片描述
表示用户矩阵或者物品矩阵向量
在这里插入图片描述
此处是指示函数,当b为真的时候取1否则取0。
在这里插入图片描述
此处的激活函数为sigmoid
BPR-OPT的推导过程如下:
在这里插入图片描述

满足:
在这里插入图片描述

求偏导,有如下的训练过程:
在这里插入图片描述
在这里插入图片描述
最后结合KNN和MF求出最终的物品排名

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值