一、基本信息
论文题目:《Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba》
发表时间:KDD 2018
论文作者及单位:
论文地址:https://arxiv.org/abs/1803.02349
二、摘要
推荐系统(RS)已经成为中国最大的在线C2C平台淘宝业务增长的最重要技术。淘宝面临三大挑战:可扩展性、稀疏性和冷启动。在本文中,我们提出了解决这三个挑战的技术解决方案。这些方法基于一个著名的图形嵌入框架。我们首先从用户的行为历史构建一个项目图,并学习图中所有项目的嵌入。项目嵌入用于计算所有项目之间的成对相似性,然后在推荐过程中使用这些相似性。为了减少稀疏性和冷启动问题,将侧面信息嵌入到图形嵌入框架中。我们提出两种聚合方法来整合项目的嵌入和对应的侧信息。离线实验的实验结果表明,加入侧信息的方法优于不加入侧信息的方法。此外,我们还描述了部署嵌入方法的平台和处理淘宝亿级数据的工作流程。通过A/B测试,我们发现在线点击率(ctrs)比以前广泛应用于淘宝的基于协同过滤的方法有所提高,进一步证明了我们所提出的方法在淘宝直播环境中的有效性和可行性。
三、主要内容与工作
1 INTRODUCTION
互联网技术一直在不断重塑商业格局,如今在线商业无处不在。阿里巴巴是中国最大的在线业务提供商,它使全世界的人或公司都有可能在线开展业务。拥有10亿用户的阿里巴巴,2017年的商品总量(GMV)为3767亿元,2017年的收入为1580亿元。在中国最大的网络购物节“双十一”中,2017年的交易总额约为1680亿元。在阿里巴巴的各种在线平台中,最大的在线消费者对消费者(c2c)平台淘宝1占据了阿里巴巴电子商务总流量的75%。
淘宝拥有10亿用户和20亿物品,即商品,最关键的问题是如何帮助用户快速找到需要的和有趣的物品。为了实现这一目标,推荐成为淘宝网的关键技术,旨在根据用户的喜好为用户提供有趣的商品。例如,移动淘宝应用程序的主页(见图1)是根据用户过去的行为和推荐技术生成的,占推荐流量的40%。此外,建议在淘宝的收入和流量中占据了绝大多数。总之,推荐已经成为GMV和淘宝、阿里巴巴收入的重要引擎。尽管学术界和行业中各种推荐方法都取得了成功,如协同过滤(CF)[9、11、16]、基于内容的推荐方法[2]和基于深度学习的推荐方法[5、6、22],但这些推荐方法所面临的问题在淘宝由于用户和物品规模达数十亿而变得更加严重。
淘宝面临三大技术挑战:
•可扩展性:尽管许多现有的推荐方