推荐 --召回模型 DSSM, YoutubeDNNd

原创于 2025-03-25 12:33:22 发布 · 418 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

学习内容： DSSM和YOUtube DNN模型

一、YouTubeDNN召回

YouTubeDNN召回模块没有把CTR作为优化目标，而是预测用户下一个观看的视频（next watch），也就说给定一个用户及上下文后，在候选集（所有视频）中挑选用户在下一次最可能观看的视频（next watch，这里一般是topK个），因此即转化成了一个多分类问题（数百万），这里使用一个softmax输出在所有候选视频上的概率分布。
用公式形式化的定义就是：

样本构造
再来看YouTube这里样本的构造，这里把用户看完的视频作为正样本（注意是看完的，也就是完成播放的，而不是看了的）。YouTube这里也解释了为什么没有使用YouTube上面『点赞』和『踩』这种显式反馈作为正负样本，因为使用完播这种隐式反馈所能构造出来的正样本比显式反馈的『点赞』多了一个数量级。正常情况下，用户看完一个视频去点一下『赞』这种行为是比较少的。

这里有必要说下训练样本是怎么构造的，感觉也是个非常大的细节。就拿我们自己的日志举例子吧，我们的原始日志都是item级别的（有曝光的item），一条原始日志由<item信息，用户信息，上下文信息，是否点击>组成，我们在抽取训练样本时，只抽取有点击的item，显然该点击的item就为生成的训练样本的label，然后我们需要去用户过去X天点击的item序列，用户过去X天query历史，以及一些该item相关的特征等。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。