【文献阅读】2019-SIGKDD-Dual Sequential Prediction Models Linking Sequential Recommendation and Informatio

提出一种结合序列推荐和信息传播的双序列预测模型(DEEMS),通过用户和项目中心模型的博弈训练,有效区分假阴性样本,提升预测精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

说明

  1. 原文链接
  2. 此处翻译不全,仅到其主要思想部分。

标题

  1. 题目:Dual Sequential Prediction Models Linking Sequential Recommendation and Information Dissemination
  2. 作者:

    Qitian Wu1, Yirui Gao1, Xiaofeng Gao1∗, Paul Weng2, Guihai Chen1

    1Shanghai Key Laboratory of Scalable Computing and Systems,

    Department of Computer Science and Engineering, Shanghai Jiao Tong University

    2UM-SJTU Joint Institute, Shanghai Jiao Tong University

    echo740@sjtu.edu.cn,gaoyirui98@gmail.com,gao-xf@cs.sjtu.edu.cn,paul.weng@sjtu.edu.cn,gchen@cs.sjtu.edu.cn

  • 摘要

序列推荐(sequential recommendation)和信息传播(information dissemination)是序列信息检索的两大问题,这两个问题的共同目标是基于过去观察到的交互来预测未来的用户-项目交互。区别在于前者处理的是用户点击项目的历史记录,而后者关注的是项目“感染”用户的历史记录,本文从新的角度出发,提出了将这两种思维范式统一起来的双序列预测模型。一个以用户为中心的模型将用户的交互历史序列作为输入,捕获用户的动态状态,并根据用户过去的单击日志近似计算给定项目的下一次交互的条件概率。一个以项目为中心的模型利用项目的历史,捕获项目的动态状态,并基于项目过去的感染记录近似给定用户下一次交互的条件概率。为了利用这一双重信息,我们设计了一种新的训练机制,让两个模型互相进行博弈,利用对手的预测分数设计反馈信号来指导训练。结果表明,与单序列推荐或信息传播模型相比,对偶模型能更好地区分假阴性样本和真阴性样本。在四个真实数据集上的实验证明了该模型相对于某些强基线的优越性,以及两个模型之间双重训练机制的有效性。

  • 介绍

记录用户和项之间的交互的序列数据在许多实际场景中是普遍存在的。序列信息检索中一个众所周知的研究问题是基于观测来预测未来的交互作用。在推荐系统中,平台可以根据用户的购买或浏览记录,尝试为每个用户推荐商品。在社交网络服务,一些用户生成的物品(如微博,图片或视频)可能会产生一个巨大的数量的股票或转发,和一个想要预测谁将影响下一个项目的历史的基础上被感染的用户(借用流行病学中的一个术语,将信息传播和病毒感染进行类比)。这两种情况分别对应两个经典的序列预测问题:序列推荐[9,16,29,40,46]和信息传播[28,30,34,45]。这两个问题具有双重结构,如图1所示。

已有的研究采取不同的观点,发展了不同的思维流派,分别处理这两个预测任务。一方面,对于序列推荐(图1.a),以前的工作倾向于根据用户u点击Iu的历史,模拟用户u点击(转发或共享取决于域)下一项i的条件概率,P(点击| (u, i), Iu)。例如,他们采用马尔科夫链[9,29]、时间感知SVD[23]、平移模型[13,14]、RNN模型[16,35,44]以及自注意力机制[20,46]来近似这个条件概率。另一方面,对于信息传播(图1.b),以往的研究一般是根据项目i的被感染用户Ui历史,考虑下一个用户u被项目i感染的条件概率,即P(点击| (u, i),Ui)。这些方法包括流行病模型[30,33]、随机点过程[2,32,45]、回归模型[25,26]以及递归神经网络[3,6]。而这两种思维方式有各自的理论基础,可以捕捉到用户行为(或项目影响力)的时间依赖性。他们假设一个项目的属性(或用户的兴趣)是静态的,因此忽略了对方的时间依赖性。事实上,一方面,对于序列推荐,当来自不同社区的用户点击时,项目的属性往往会动态变化,这可能会随着时间的推移而改变项目对用户的吸引力。另一方面,在信息传播过程中,用户在接触不同的物品时,其兴趣会发生变化,这就启发我们考虑不同的用户偏好。

然而,同时建模双边时间依赖关系并把分布P(点击| (u, i

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lechuan_dafo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值