YouTube DNN在召回上的一些实验记录——负样本的选取

最新推荐文章于 2025-07-07 09:20:21 发布

原创

最新推荐文章于 2025-07-07 09:20:21 发布 · 2.2k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #神经网络 #机器学习

负样本随机采样

1. 采样细节和auc

在构建YouTube的负样本的时候针对样本数据，我们采用对所有正样本覆盖到的视频随机采样的方式进行负样本的选取。

一条输入的样本数据对应下一个点击的视频vid作为正样本，63个随机挑选的vid作为负样本。

采用随机采样我们训练得到的模型auc如下:

epoch 0, auc: 0.975047328233897 
epoch 1, auc: 0.9787315107784329
epoch 2, auc: 0.9768194927164626
epoch 3, auc: 0.975806570236023 
epoch 4, auc: 0.9728442576988845

2. 用户向量

在训练好的模型中，通过YouTube DNN得到用户的实时向量。

在计算得到的用户向量总的维度为342其中为激活值为0.0的结果为210个。

在以ReLu为激活函数的神经网络中，激活值为0的神经元在模型训练的过程中，无法通过反向传播再更新参数。

这样的神经元称为死亡神经元:

在这种情况下YouTube DNN最后一层的神经元的死亡率为61.58%

曝光负样本采样

1. 采样细节和auc

除了使用随机负采样的方式，我们还通过选取对应用户曝光未点击的视频作为负样本，点击的视频作为正样本。

通过曝光负采样，在模型训练过程中测试集上得到的auc如下:

epoch :0, auc :0.8541589495078
epoch :1, auc :0.869886817686467
epoch :2, auc :0.877884247163766
epoch :3, auc:0.88235782102

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

寻沂

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

召回/粗排阶段 负样本常见构造方法

weixin_43646592的博客

05-18

1516

召回/粗排阶段 负样本常见构造方法

推荐系统经典模型YouTubeDNN

小叮当的博客

02-23

2440

我们可以把召回模型的结构分为三层。输入层：输入层总共有四种特征。用户看过视频的 Embedding（embedded video watches）用户搜索的关键词的 Embedding 向量（embedded search tokens）用户所在的地理位置的特征（geographic embedding）适用于冷启动用户基本特征（example age, gender）

4 条评论您还未登录，请先登录后发表或查看评论

【推荐系统】YoutubeDNN召回

littlemichelle

01-17

3157

主要是按照以下3篇介绍+评论的脉络来整理（讲的真的超级好！），再加上我自己在实际运用过程中产生的问题。重读Youtube深度学习推荐系统论文，字字珠玑，惊为神文 - 王喆的文章 - 知乎 YouTube深度学习推荐系统的十大工程问题 - 王喆的文章 - 知乎揭开YouTube深度推荐系统模型Serving之谜 - 王喆的文章 - 知乎推荐系统遇上深度学习(三十四)--YouTube深度学习推荐系统 https://github.com/onozeam/YoutubeDNN（...

【推荐系统】YoutubeDNN召回（2）

littlemichelle

02-01

731

关于 example age Q： A： Q： A：训练时这个值，姑且认为是『训练时间-Sample Log的产生时间』就是『模型训练此刻的时间-该日志产生的时间』。在线上服务阶段，该特征被赋予0值甚至是一个比较小的负数。这样的做法类似于在广告排序中消除position bias。直觉理解：假设这样一个视频十天前发布的，许多用户在当前观看了该视频，那么在当天会产生许多Sample Log，而在后面的九天里，观看记录不多，Sample Log也很少。如果我们没有加入Example Age这个...

负样本的艺术，再读Facebook双塔向量召回算法

炼丹笔记

07-06

617

负样本的艺术，再读Facebook双塔向量召回算法Facebook这篇Embedding召回的论文，之前已经有几篇文章涉及过了，分别是《Embeding-based Retrieval in FaceBook Search》、《是"塔"!是"塔"!就是"它"，我们的双塔!》和《负样本修正：既然数据是模型的上限，就不要破坏这个上限》，有兴趣的可以回顾一下。在以上几篇文章中，模型结构没啥好说的，简单的...

召回和粗排负样本构造问题

12-02

2873

大家好，我是对白。今天给大家分享一下在推荐中召回和粗排是如何构造负样本的。推荐系统通常分为召回->粗排->精排->重排这几个漏斗。深度模型也从精排逐步下沉到了粗排和召回。拿业界常用的粗排DSSM模型来说，模型训练样本的构造方式一般是复用精排下发的正负样本，但这会造成一个问题：粗排训练样本和实际线上打分样本分布不一致，训练样本仅是线上打分样本一个比较小的子集。面对这个问题大家通常的解法是，从精排未下发的样本里采一部分，添加至粗排模型的训练负样本中，通常会带来一定的提升。其中的原理是什

weixin_46838716的博客

08-28

8958

youtubeNet已经很古老了，适合召回，反正就是搞清楚usr embedding的过程呗，配合item embedding，就可以做双塔模型召回了，另外，独特的场景，考虑独特的特征，很重要，视频推荐，图文推荐，美食推荐，各有不同的场景的...

YouTube DNN论文精读

猜丁壳

01-14

1114

文章目录Abstract1. Introduction2. System Overview3. Candidate Generation3.1 Recommendation as classification3.2 Model Architecture3.3 Heterogeneous Signals3.4 Label and Context Selection3.5 Experiments with Features and Depth4. RANKING4.1 Feature Representatio

推荐算法之召回模型：DSSM、YoutubeDNN

A496608119的博客

06-22

2205

，由微软研究院提出，利用深度神经网络将文本表示为低维度的向量，应用于文本相似度匹配场景下的一个算法。不仅局限于文本，在其他可以计算相似性计算的场景，例如推荐系统中。根据用户搜索行为中（文本搜索）和（要匹配的文本）的日志数据，使用深度学习网络将query和doc映射到相同维度的语义空间中，即query侧特征的embedding和doc侧特征的embedding，从而得到语句的低维语义向量表达sentence embedding，用于预测两句话的语义相似度。模型结构：user侧塔和item侧塔分别经过各自的D

算法金 | 经典！YouTube 推荐系统 - 年度最佳 Paper

算法金「全网同名」的博客

06-02

882

大侠幸会，在下全网同名[算法金] 0 基础转 AI 上岸，多个算法赛 Top [日更万日，让更多人享受智能乐趣]

学习小白的推荐系统之路——Task 03 多路召回

m0_48813246的博客

11-30

435

学习内容 1、基于关联规则的itemcf 2、基于关联规则的usercf 3、youtubednn召回 4、冷启动召回学习过程多路召回所谓的“多路召回”策略，就是指采用不同的策略、特征或简单模型，分别召回一部分候选集，然后把候选集混合在一起供后续排序模型使用，可以明显的看出，“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中，各种简单策略保证候选集的快速召回，从不同角度设计的策略保证召回率接近理想的状态，不至于损伤排序效果。这便是多路召回的基本概念。下面展现多路召回的一个示意图，在

负样本为王：评Facebook的向量召回算法

夕小瑶科技说

08-15

1466

星标/置顶小屋，带你解锁最萌最前沿的NLP、搜索与推荐技术有人的地方就会有江湖，就会有鄙视链存在，推荐系统中也不例外。排序、召回，尽管只是革命分工不同，但是我感觉待遇还是相差蛮大的排序排...

召回负样本选取梳理

zhouwenyuan1015的博客

04-29

2819

参考： https://zhuanlan.zhihu.com/p/165064102 Embedding-based Retrieval in Facebook Search 相关 https://zhuanlan.zhihu.com/p/144765227 MOBIUS- Towards the Next Generation of Query-Ad Matching in Baidu’s 相关 https://www.cnblogs.com/pinard/p/7243513.html word

Bubbliiiing的学习小课堂

01-08

3396

当物品池很大上百万甚至是上亿的时候，不能仅考虑少量的正样本与负样本，因为物品太多，大多数物品都是负样本，此时双塔召回模型常常需要针对每个正样本采样一千甚至一万的负样本才能达到比较好的召回效果，

YouTube 推荐系统召回方法

goTsHgo的博客

12-05

976

YouTube 的召回阶段通过 DNN 模型，将用户行为和视频特征结合起来，生成高效、个性化的候选集。通过上述代码和原理分析，我们可以清晰地理解 YouTube 的召回机制如何设计以及其背后的原因。

【王树森推荐系统】召回07：双塔模型——正负样本