
推荐系统
文章平均质量分 94
han1254
计算机专业学生
展开
-
SIGIR22:Bilateral Self-unbiased Learning from Biased Implicit Feedback
协同过滤是目前构建推荐系统最流行的技术。协同过滤经常使用两种用户反馈:显式和隐式反馈。显式反馈提供了更加丰富的用户偏好,因为用户精确地评估了他们有多喜欢或者不喜欢项目。然而,在多样的真实世界应用中收集精确反馈是很困难的,因为很少的用户会在体验了项目之后会提供反馈。另一方面,隐式反馈很容易通过记录很多的用户行为来进行收集,例如点击链接、购买产品或者浏览网页。在协同过滤中使用隐式反馈存在着一些挑战:(i)现存的研究将观测的用户交互仅当作正反馈,例如点击一个项目或者查看一个页面,并不表示用户是否喜欢该项目。翻译 2023-02-25 11:14:39 · 382 阅读 · 1 评论 -
WWW22: CAUSPref_Causal Preference Learning for Out-of-Distribution Recommendation
常见的推荐方法有协同过滤[18]、基于内容的推荐[24]、混合推荐[29]等等。最近,深度神经网络DNN[2]和图卷积神经网络GCN[21]提升了推荐系统的性能。目前大部分的推荐系统假设原始训练和测试数据是独立同分布(I.I.D)的。然而这个假设常常是与现实中的推荐情景相违背的。现实中的数据不可避免地存在分布的偏移问题。第一种偏差在文献中很少被研究,同时也缺乏一种统一的方法来处理这两种分布的变化。这种问题也被称为OOD问题(out-of-distribution)翻译 2023-02-22 14:10:36 · 445 阅读 · 0 评论 -
SIGIR22:User-controllable Recommendation Against Filter Bubbles
由于仅仅是拟合数据,推荐系统常常面临过滤气泡问题:持续推荐很多同质性的项目,将用户和多样化的内容隔离开。例如,如果用户点击了很多短视频,来学习制作咖啡,系统可能会持续向其推荐不同视频上传者投稿的相似短视频,占据了其他诸如热点新闻等信息丰富的视频。更糟糕的是,因为如图一的反馈循环,过滤气泡可能会逐渐地变得严重。从长远来看,过滤气泡将会减少用户的积极性以及项目的创造性,会损伤整个生态环境。因此,消除过滤气泡是很重要的。为了实现这一目标,现有的研究提出纳入额外目标的历史交互数据拟合。例如(1)多样性[6]原创 2023-02-11 20:26:05 · 1018 阅读 · 0 评论 -
【SIGIR22】使用反事实生成器来消除知识感知推荐中的虚假联系
知识图谱将实体信息组织成元组的集合,为推荐系统提供了辅助信息,来丰富项目的表示以及捕获在项目属性上的结构化偏好。因此,知识感知的推荐器更加能够提供准确以及可解释的推荐。为了利用知识图谱的信息,现有的知识感知推荐方法主要集中于如何设计有效的推荐系统神经结构。虽然在一定程度上这种做法很有效,但是这些方法只学习了项目知识以及用户行为之间的表层联系。因此,由于虚假联系导致的潜在效应,模型的合理性以及可靠性在一个更加泛化的设定下可能无法得到保证。翻译 2023-01-28 20:29:37 · 1522 阅读 · 1 评论 -
【WWW‘ 22】Unbiased Sequential Recommendation with Latent Confounders
最近序列推荐由于其更贴合实际的设置获得了逐渐增加的吸引力以及更好的推荐效果。通过对用户连续动作之间的关系进行建模,使得序列推荐优于传统的推荐。FPMC[22]模型基于用户最新的行为估计当下的用户偏好。GRU4Rec[16]模型将循环神经网络引入,来建模更加综合的历史信息。NARM[17]使用注意力机制来区分不同用户行为的重要性。这些模型持有的主要假设是,训练数据可以很好地表示用户的序列偏好。然而,该假设在实际中是存疑的。翻译 2023-01-13 17:52:54 · 2547 阅读 · 0 评论 -
【WWW ‘22】A Model-Agnostic Causal Learning Framework for Recommendation using Search Data
基于机器学习的推荐系统已经成为人们自动发现兴趣的一种有效的方式。现有的方法经常将推荐的富信息,例如项目、用户、以及上下文等信息表示为embedding向量,并且利用这些向量来预测用户的反馈。从因果分析的角度来看,嵌入向量与用户反馈之间的关联,混合了能够表示用户为何偏好某个项目的因果部分以及仅仅表示统计相关性的非因果部分,例如曝光机制、公共观点、展示位置等。然而,现存的推荐系统在使用这些嵌入向量的时候大都忽略了因果部分和非因果部分之间的显著差异。翻译 2023-01-01 20:48:54 · 897 阅读 · 1 评论 -
Causal Representation Learning for Out-of-Distribution Recommendation
现代的推荐系统会从历史交互数据种学习用户表示,会受到用户特征偏移的影响,例如用户收入的提升。历史交互数据会将过时的历史交互信息注入到用户表示种,而这些信息是与用户最新的特征相冲突的。本文将分布外(out-of-distribution)推荐问题视为一种用户特征产生偏移的环境。为了达到高可信度,我们为学习设置了两个目标:1. 稳健的OOD泛化性;2. 快速的OOD适应性。翻译 2022-12-21 21:15:25 · 842 阅读 · 0 评论 -
RecSys2021反事实评估学习教程
反事实评估器允许我们使用现存的日志数据来评估当我们使用新的目标推荐策略来替换之前的策略时候会如何表现。我们称这些评估器以“异策略(off-policy)”的方式在工作。反事实衡量器引出了类似于无偏离线A/B测试的“异策略衡量(Off-policy Evaluation, OPE)”方式以及通过“异策略学习(Off-policy Learning, OPL)”习得的新的推荐策略。原创 2022-11-15 21:37:41 · 821 阅读 · 0 评论 -
【论文不精读】Reinforced Path Reasoning for Counterfactual Explainable Recommendation
Reinforced Path Reasoning for Counterfactual Explainable Recommendation原创 2022-10-28 16:44:46 · 1145 阅读 · 0 评论 -
【论文精读】Counterfactual Explainable Recommendation
可解释反事实推荐,Counterfactual Explainable Recommendation原创 2022-10-19 23:13:56 · 762 阅读 · 0 评论 -
推导多元最小二乘法的计算方法
对多元最小二乘法的推导原创 2022-10-18 10:03:49 · 1658 阅读 · 0 评论 -
估计β1等于总体的协方差除以x的方差
为何β1等于总体的协方差除以x的方差。原创 2022-10-18 10:02:02 · 1896 阅读 · 0 评论 -
【综述精读】:Causal Inference in Recmmender Systems(因果推论在推荐系统中的应用)
如今的推荐系统的基本思想是对“关联”进行建模,例如协同过滤中的行为联系(behavior correlation),或者是CTR中的特性-特性(feature-feature)、特性-行为(feature-behavior)联系。然而,现实世界是由因果关系推动的,而不是所谓的联系,联系并不意味着存在因果关系。原创 2022-09-15 08:17:37 · 2057 阅读 · 0 评论 -
【论文翻译和解释(2)】LOF:Identifying Density-Based Local Outliers论文精读
以上的例子说明了DB(pct,dminpct,dminpct,dmin)-outliers持有的全局观点是有意义的,并且在特定的情况下是完全可用的,但是对于存在不同密度簇的一般情况是不适合的。目前的关键情况在于,离群情况不应该是一个二元值。相反,我们赋予每个对象一个离群因子,这是对象的离群程度。(对象ppp的kkk-distance)对于任何一个正整数kkk,k−distance(p)k−distance(p)p。......原创 2022-07-31 16:54:22 · 1215 阅读 · 0 评论 -
【论文翻译和解释(1)】Mitigating Confounding Bias in Recommendation via Information Bottleneck
如何有效地减少推荐系统中的反馈偏差是一个重要的研究课题。本论文中,我们首先通过两种各自的因果图描述了推荐系统中有偏差和无偏差反馈的生成过程,他们之间的差异可以视作偏差的来源。我们将这种差异定义为,这些偏差可以视为一些以前已经研究过的特定偏差的集合。对于仅有反馈偏差情况,我们从因果图中推导了需要获得去偏表示的情况。基于信息论,我们提出了一种叫做**无偏信息瓶颈理论(debiasedinformationbottleneckDIB)**的新颖方法来优化这些情况并且找到了一种对于它的易于解决的解法。...翻译 2022-07-30 10:15:49 · 1178 阅读 · 1 评论 -
Collaborative Filtering for Implicit Feedback Datasets结论公式推导
精确反馈的假设并不总是可行的。一个用户可能选择不去对不喜欢的物品做出反映,这使得这样的一个交互条目缺失。或者数据并不能第一时间就捕获到用户的确定的偏好。例如一个点击数据流集合只能显示出用户浏览物品的频繁程度,却不能等价地说明用户喜欢这个商品。事实上用户在第一次浏览商品之前不可能会表示出对商品的反感。或者用户已经在别的地方见到过这个商品并且选择再也不看了,因为他对这个商品不感兴趣。这些情况下用户都不喜欢这个商品,但是没有方法可以仅凭点击流辨别出用户的真实喜好。这就是为什么隐式反馈的方法出现。...原创 2022-07-04 18:30:51 · 278 阅读 · 0 评论