【论文导读】KDD2020|阿里团队最新的多元兴趣推荐模型---ComiRec

本文介绍了阿里团队在KDD2020发表的ComiRec模型,该模型针对推荐系统匹配阶段,解决序列推荐问题,通过多元兴趣模块捕捉用户多种兴趣,再通过聚合模块平衡推荐准确性和多样性。模型采用了动态路由和自注意力机制来提取兴趣,实验证明其在召回率、点击率和NDCG等指标上优于其他先进模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

本次分享一篇2020年阿里团队发表在KDD的文章“Controllable Multi-Interest Framework for Recommendation”。本篇文章提出的模型ComiRec是基于推荐系统中匹配/召回的方法,且是一个序列化推荐的解决方案。由于是当前最新的序列化推荐匹配模型,因此会详细的介绍其背景、方法与实验。

本文约4.5k字,预计阅读15分钟。

1. 研究背景

1、对于工业界的推荐系统来说,一般由匹配/召回(matching)阶段和排序/精排(ranking)阶段组成。「匹配主要是检索出Top-K个候选物品」,而「精排则是通过更精确的分数来对候选物品进行排序」。本篇文章,主要「聚焦于匹配问题」,提高匹配的性能。

2、可以将推荐系统看作是一个「序列推荐问题」,即想要预测用户下一个可能交互的物品。

3、目前推荐系统的「准确性」并不是唯一的问题,人们更有可能被推荐一些新的或「多样化」的东西【长尾问题】。

本篇文章主要是基于上述三个研究背景进行展开。

2. 研究现状

1、传统的推荐方法主要是用协同过滤来预测分数。后来演变成用神经网络---对建立用户与物品的表示,并比传统方法的性能更为优越。但对于大规模的电子商务系统,很难直接使用神经网络给出用户对目标物品的CTR预估。现如今工业界使用快速KNN(如Faiss[1])来生成一个候选物品集,然后使用神经网络模型(如xDeepFM[2])来整合用户物品属性,以优化诸如CTR之类的业务指标。

2、当然最近也有使用「图嵌入」(Graph Embedding)来表示用户和物品。PinSage[3]建立在GraphSAGE[4]的基础上,将基于图卷积网络的方法应用于具有数十亿节点和边的数据。GATNE[5]考虑了不同的用户行为类型,并利用一种异构的图嵌入方法来学习用户和物品的表示。但是这些方法忽略了用户行为中的序列信息,无法捕捉相邻用户行为之间的相关性。【引入序列推荐】

3、推荐也可以看作一个序列化问题,通过用户的历史,来估计下一个用户感兴趣的物品。很多模型(DIN、DIEN)都从用户的行为序列给出一个整体的Embedding。但是,统一的用户Embedding不能反映用户在一段时间内的「多种兴趣」。如下图所示:

Emma对珠宝、包、化妆品感兴趣,她在这段时间内应该可能会点击三种类别的物品。

【注】本篇文章对推荐的分类:传统、基于神经网络(端到端、非端到端)、从基于神经网络的模型细化到基于图表示、再从用户历史行为中得到序列化推荐。基于图表示和序列化推荐是目前较为热门的研究方向。大家可以看一下文章的一些引用文献。

3. 创新与贡献

基于上述问题,作者提出一个新的序列化推荐模型:「controllable multi-interest framework,ComiREC」。模型分为「多元兴趣模块」(multi-interest module)和「聚合模块」(aggregation module)。多元兴趣模块从用户行为序列中捕捉多种兴趣,可以在大规模的物品池中检索候选的物品集。然后将这些物品输入到聚合模块以获得总体Top-K推荐。并且聚合模块利用「可控因素」(controllable factor)来「平衡推荐的准确性和多样性」

4. 模型方法


4.1 问题定义

假设一个用户集合 和一个物品集合 ,对于每一个用户,定义用户序列 ,根据时间先后顺序排序。 记录了第 个物品与用户交互。文章所有的字母表示含义见下表:


4.2 多元兴趣模型整体框架

在工业推荐系统的物品池中经常有上百万或亿级别的物品,因此匹配阶段在推荐系统中扮演一个非常重要的角色。

对于「匹配阶段模型」

  1. 首先通过用户历史行为序列计算出用户的「embedding」,然后基于embedding检索用户的候选物品集合。

  2. 然后利用快速K近邻(KNN)算法从大规模物品池中为每个用户生成最接近的物品集。

匹配阶段的决定性因素是根据用户历史行为计算出的「用户Embedding的质量」。对于部分序列模型只是建立一个单一的用户Embedding,但是其缺乏表达能力,因为现实世界的用户通常同时对几种类型的物品感兴趣,这些物品通常用于不同的用途,并且在类别上有很大的差异。因此作者提出了用于推荐系统的多元兴趣框架(「Multi-Interest Framework」),主要分为多元兴趣提取模块和聚合模块。


4.3 多元兴趣提取模块

本篇文章,作者主要使用两种方法:「动态路由法」[^6](dynamic routing method)和「自注意力机制法」(self-attentive method)来作为兴趣提取方法,分别对应的模型称为「ComiRec-DR」「ComiRec-SA」

Dynamic Routing Method

使用「动态路由方法」作为用户行为序列的多兴趣提取模块。将用户行为序列的物品embedding列表看作是「最初的胶囊(primary capsules)」,多元用户兴趣看作是「兴趣胶囊(interest capsules)」

胶囊网络的概念是在2011年首先提出的,并在动态路由方法提出后广为人知。「胶囊是一组神经元」,其活动向量代表一个特定类型实体的实例化参数。胶囊的输出向量的长度表示由胶囊所表示的实体在当前输入中的概率。

表示最初层的胶囊 ,可以给出基于最初胶囊的下一层的兴趣胶囊 的计算:

其中 表示一个转换矩阵,那么胶囊 「总输入」是所有预测向量

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值