Disentangled Causal Embedding With Contrastive Learning For Recommender System
摘要
推荐系统通常依赖观察到的用户交互数据来构建个性化推荐模型,并假设这些观察数据能够反映用户的兴趣。然而,用户与某一物品的交互也可能是由于从众心理,即跟随热门物品的需求所导致的。大多数现有研究忽略了用户的从众心理,并将其与兴趣混为一谈,这可能导致推荐系统无法提供令人满意的结果。因此,从因果关系的视角来看,解耦这些交互原因是一个关键问题。这对于解决训练数据和测试数据分布不一致(OOD)的问题也有所帮助。然而,由于缺乏区分兴趣和从众心理的信号,加之纯粹因果数据的稀疏性以及物品长尾问题的存在,解耦因果嵌入变得非常具有挑战性。
为了解决这些问题,本文提出了一种名为 DCCL 的框架,它通过对兴趣和从众心理分别进行样本增强,结合对比学习来解耦这两种原因。此外,DCCL 是模型无关的,能够轻松部署到任何工业级在线系统中。
引言
主要对浪漫电影感兴趣的女孩也打算观看最受欢迎的电影之一复仇者联盟。虽然她对科幻小说不感兴趣,但这吸引了她去弄清楚为什么复仇者联盟能受到如此多的关注。此外,她的每一个选择都是由兴趣和从众心理组成的,并且在不同的电影中分布不同。这个例子表明,一致性也是一种内在的需要,值得充分关注和兴趣。
以往的研究大多忽略了从众的价值。由于它干扰了利益模型,从众一直被认为是有害的。许多研究消除了流行性偏差以提取纯粹的兴趣[1,10,27],例如基于逆倾向评分(IPS)[5,16,19],或利用一小部分无偏数据[3]。这些操作消除了一致性效应,只推荐基于兴趣的项目。[27]认识到受欢迎程度具有积极作用,应予以保持。但是,一个项目的流行效应对所有用户都是一样的,这并不能反映从众的个性化。此外,在工业应用中,流行度在训练和测试数据中通常是分布外的(OOD),上述方法无法有效解决它。[28]通过根据项目对的相对流行度将观察到的数据分为仅整合部分和整合部分,学习用户和项目侧的分离兴趣和整合嵌入。它说明了为结果(相互作用)解开原因(兴趣和一致性)的必要性:解开因果嵌入的模型更鲁棒和可解释。然而,解开因果嵌入的挑战仍然存在:首先,兴趣和一致性集成在观察到的数据中,我们缺乏区分它们的信号,这使得难以在原始观察数据上进行训练。其次,不同原因的交互作用不充分,并且在现实世界的推荐系统中存在大量的长尾项目。这两个稀疏性问题使得分离的因果嵌入更难学习。
在这项工作中,我们首先制定了一个因果图[11,13](上图)来描述相互作用的原因。因此,每个用户-项目对的交互由两个原因组成:兴趣和一致性。这两个原因同时受用户和物料的影响。在此基础上,我们提出了基于对比学习的去纠缠因果嵌入(DCCL)的一般框架,以学习基于因果机制的去纠缠兴趣和一致性嵌入[2,13]。该框架仅处理嵌入,并可应用于任何特定的模型,如MF和LightGCN。对比学习[23,29]是一种自监督技术,用于通过在相似和不同的视图中增加样本来增强模型表示,这对数据稀疏非常有效。为了更好地学习去纠缠嵌入,我们利用流行度信号分别增加了兴趣和一致性样本。
本文的主要贡献如下:
- 提出了一个直接基于观测数据的对比学习的因果嵌入的一般框架。样本扩充为不同的原因和长尾项提供了足够的样本,有效地解决了数据稀疏性问题,增强了原因表示。
- 此外,该框架可以应用于任何基础模型。·在两个真实世界数据集上进行了大量实验。实验结果表明,与SOTA基线相比,本文所提出的方法不仅对OOD环境有显著提升,而且具有良好的鲁棒性.我们将DCCL部署到了一个十亿用户规模的短视频推荐系统–快手上。在线A/B测试结果表明,在有效浏览率和喜欢浏览率上有了很大的提高,尤其是对于长尾项目。
方法
1.推荐系统中的因果嵌入
为了增强推荐系统的性能,已有一些基于因果关系的方法被提出,例如 IPS 方法、因果嵌入和反事实推断等。本文提出了一个基于因果嵌入的框架,通过因果图来描述推荐过程中的重要因果关系,如上图所示。
将不同的原因解耦为因果嵌入具有以下优势:
- 从交互生成的角度,更加准确地建模用户对不同原因的个性化偏好。
- 因果建模可以生成更稳健的模型,并具有更强的泛化能力。
此外,用户与物品的交互通常受到多种原因的驱动,例如物品的流行度、类别和质量等。根据先前的研究,我们主要聚焦于用户兴趣和从众心理这两个主要原因来建模用户与物品的交互。
2. 对比学习
在真实的推荐系统中,长尾物品的数量非常庞大,而用户交互数据通常极其稀疏。这两个稀疏性问题使得学习解耦嵌入更加困难。因此,为了直接在观察到的交互数据上充分学习解耦的因果嵌入,本文采用对比学习对每种原因的样本进行增强。
3.学习和讨论