论文背景
Deep Neural Networks for YouTube Recommendations
RecSys’16
谷歌学术引用次数为1201(截至2020年12月15日)
作者:Paul Covington, Jay Adams, Emre Sargin
Google
Mountain View, CA
关键词:recommender system; deep learning; scalability
PDF
Introduction 引言
YouTube推荐系统的三大挑战:
- Scale 大规模
- Freshness 新鲜度
- Noise 噪声-数据往往是隐式反馈
System Overview 系统概述
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-K9B35nzh-1634386808597)(\images\Paper-YouTube-整体架构.png)]
系统由两部分组成:候选生成部分和排序部分。
候选生成部分输入是用户历史活动事件,使用协同过滤从大数据集中输出小子集。
排序部分根据目标函数对每个视频精排打分,最高分视频推荐给用户。
优点:从大数据集中选出的小数据集依然具有个性化特征,并且候选生成部分可以添加别的数据源。
评价指标:精确率、召回率、排序损失等
最后通过A/B测试在线实验(A/B测试结果不总是和离线实验结果相一致)。
Candidate Generation 候选生成
这种方法可以看作矩阵分解的非线性推广,它早期的神经网络迭代只嵌入用户过去观看记录来模拟这种因子分解行为。
Recommendation as Classification 作为分类推荐
推荐视为极端多分类问题,在时间t时,结合用户U和上下文C,从数亿的数据库V中选择一个视频i记为特定的视频 w t w_t wt。
P ( w t = i ∣ U , C ) = e v i u ∑ j ∈ V e v j u P(w_t = i|U,C) = \frac{e^{v_iu}}{\sum_{j∈V}e^{v_ju}} P(wt=i∣U,C)=∑j∈V

论文介绍了YouTube推荐系统如何利用深度学习应对大规模、新鲜度和噪声挑战。通过候选生成的矩阵分解推广,模型学习用户嵌入并优化极端多分类问题。系统关注特征工程、模型架构和预期观看时间预测,展示了深度网络在排序和特征表示中的应用。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



