深度学习CTR模型读书笔记-阿里十亿级商品嵌入方法

该笔记探讨了阿里如何应对推荐系统的可扩展性、稀疏性和冷启动问题。通过构建item graph并学习商品embedding,结合side information以增强embedding表示。提出Base Graph Embedding (BGE)、Graph Embedding with Side information (GES)和Enhanced GES (EGES)方法,特别是针对新商品或交互稀少商品的冷启动策略。此外,还讨论了如何处理用户行为序列和构建图的策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文连接:Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba

摘要:
阿里推荐系统的三大挑战,可扩展性(scalability),稀疏性(sparsity)和冷启动(cold start)。
首先通过用户历史行为构建item graph,并在graph上学习item的embedding,这个embedding用于学习item之间的pairwise similarities。为了解决稀疏性和冷启动问题,在graph embedding framework里引入side information。并提出两种聚合方法来集成item的embedding和相关的side information。加了side information的方法优于不加side information的方法。

淘宝应对可扩展性、稀疏性和冷启动三个问题设计一个two-stage框架,matching和ranking。matching拣选商品,ranking给商品排序。本文主要关注在matching阶段,这个阶段核心任务是基于user行为计算所有item的pairwise similarities。

首先基于user行为历史构建item embedding graph->dubbed Base Graph Embedding(BGE),其次考虑到那些新的item或者有极少user交互的item,引入side information构建dubbed Graph Embedding with Side information(GES)。接着考虑到不同类型的side information,就提出带权的GES,即dubbed Enhanced Graph Embedding with Side information(EGES)。

session-based users’behaviors:考虑到用户的行为是不断变化的,以及使用用户全部的历史行为计算能力和空间存在问题,对user的行为按窗口划分(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值