Wide & Deep - 学习笔记

最新推荐文章于 2022-09-16 12:07:00 发布

原创最新推荐文章于 2022-09-16 12:07:00 发布 · 199 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#神经网络 #机器学习 #人工智能

推荐系统专栏收录该内容

10 篇文章

订阅专栏

Wide&Deep模型通过结合线性模型（Wide部分）和深度神经网络（Deep部分）来提升推荐系统的性能。Wide部分利用关联规则记忆用户商品共现性，如用户购买尿布常伴随啤酒的推荐；Deep部分通过Embedding和全连接网络挖掘用户潜在兴趣，如根据足球视频推荐C罗视频。模型最终通过Joint Training优化，使用Sigmoid函数压缩输出并以Logistic Loss进行训练。

1、介绍

Wide & Deep模型的出发点是兼顾模型的记忆能力和泛化能力，下面解释一下这两者的含义。

记忆（Memorization）：指的是模型记住商品共现性的能力。举个例子，一个父亲逛淘宝通常会同时买尿布和啤酒，这就体现了商品的共现性。购买的次数多了，当模型看到尿布，自然会给用户推荐啤酒，这就是模型的记忆能力。
泛化（ Generalization）能力：只是的模型挖掘用户潜在喜好的能力。比方说，你经常刷足球类的短视频，软件就会根据足球去联想，你是不是有可能喜欢C罗呢？然后软件就会尝试给你推荐C罗的视频，这就体现了模型的泛化能力。

在Wide & Deep论文中，由线性模型加上人工设计的关联规则，来负责记忆（Memorization），称为Wide部分；由深层神经网络来负责泛化（ Generalization），称为Deep部分。
在这里插入图片描述

2、Wide

广义线性模型的表达式是：
$y=w^Tx+b$
其中， $x$ 表示特征向量。然后 $W i d e$ 部分定义了一个关联规则，用它来表示特征之间的共现性：

在这里插入图片描述
关联规则的具体表示是：只有当 $i$ 特征和 $k$ 特征同时为1时， $c_{ki}$ 才为1，否则为0。文中选择的特征是“用户下载的APP”和“用户感兴趣的APP”。

3、Deep

$D e e p$ 部分，首先会把稀疏的原始向量经过 $E m b e d d i n g$ 层，得到稠密向量，然后再经过全连接网络，进行特征交叉，提取高阶特征：
在这里插入图片描述

4、Join Training

最后，我们把 $W i d e$ 部分和 $D e e p$ 部分的输出加在一起，经过一个 $S i g m o i d$ 函数，把输出压缩到01之间，最后用 $L o g i s t i c$ $L o s s$ 进行训练。
在这里插入图片描述

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。