基于用户反馈与知识图谱的推荐技术研究
在当今信息爆炸的时代,推荐系统在各个领域都发挥着至关重要的作用。无论是为用户推荐合适的电影、商品,还是为科研人员推荐相关的学术文献,推荐系统都能帮助用户从海量信息中快速找到有价值的内容。本文将介绍两种不同但都十分有价值的推荐技术:基于用户反馈的反事实数据增强推荐方法(UFC4SRec)以及基于知识图谱和多任务学习的引文推荐模型。
UFC4SRec:基于用户反馈的反事实数据增强推荐
UFC4SRec 是一种用于序列推荐任务的反事实数据增强方法,它通过构建反事实生成器和推荐器,利用用户反馈来生成高质量的反事实数据,从而提升推荐系统的性能。
奖励机制
在 UFC4SRec 中,反事实生成器在进行修改操作时会根据奖励机制获得相应的奖励。奖励由两部分组成:基于信息的奖励 (R_{IB}) 和基于预测差异的奖励 (R_{PD})。
基于预测差异的奖励 (R_{PD}) 的计算公式为:
[R_{PD} = \log \left(\sigma \left(H_{i}^{\top}B_{i} - H_{i}^{\top}B_{i}^{*}\right)\right)]
其中,(\sigma(\cdot)) 是 sigmoid 函数。
最终的奖励 (R) 是这两种奖励的组合:
[R = \gamma R_{IB} + (1 - \gamma)R_{PD}]
这里的 (\gamma) 是一个平衡参数,用于调整两种奖励在总奖励中的占比。
通过最大化这个奖励,反事实生成器被鼓励生成高质量的反事实交互,从而提升推荐系统的性能。
超级会员免费看
订阅专栏 解锁全文
3883

被折叠的 条评论
为什么被折叠?



