马尔可夫链 (Markov Chain)
马尔可夫链是什么?
简单来说,就是将来的状态只和现在有关,过去的已经过去了,和之后没有关系。
有几个概念:
- 转移概率矩阵:矩阵中每一个元素表示从一个状态转移到另一个状态的概率。看一张图:

所以,我们如果知道了当前的状态,就可以用当前的状态向量乘以转移状态矩阵得到第二天的状态。
转移概率矩阵怎么得到:可以通过历史的一些状态转移进行统计得到。
FPMC
FPMC是序列推荐中最经典的算法之一,他结合了用户的兴趣以及sequence信息,对next-item进行预测。
- 非个性化马尔可夫,结合每一个用户的item转移,建立一个item * item的矩阵,这个就是状态转移矩阵,利用这个矩阵,我们可以对下一个时刻的item进行推荐。
- 个性化马尔可夫,对每一个用户建立一个状态转移矩阵,所以矩阵的维度是user * item *item,可以看出对内存是非常不友好的,而且在数据稀疏的情况下,矩阵是非常容易拟合的,所以采用矩阵分解,用潜在向量来表示sequence信息。
算法思想
-
首先计算用户在第t个时间对物品i的预测值:

U u V i u t T U_uV^T_{i_u^t} UuViutT表示用户u的兴趣偏好
P i u t − 1 Q i u t T P_{i_u^{t-1}}Q^T_{i^{t}_u} Piut−1QiutT表示当前的序列信息。
P i u t − 1 P_{i_u^{t-1}} Piut−1表示上一个时刻的item的embedding。 -
然后对这样一个pair(user , item)选取一个负样本,计算在t时刻对负样本的预测值:

j是我们选取的负样本 -
利用BPRloss计算损失函数,直观上来看就是不断拉大正样本预测值和负样本预测值的差距。
-
最后就是预测
1882

被折叠的 条评论
为什么被折叠?



