CTR 模型之 Deep & Cross (DCN) 与 xDeepFM 解读

最新推荐文章于 2025-03-01 18:30:12 发布

VariableX

最新推荐文章于 2025-03-01 18:30:12 发布

阅读量2.1k

点赞数

分类专栏： CTR 相关文章标签： DCN xDeepFM ctr

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/VariableX/article/details/107708856

版权

本文深入解析CTR模型中的Deep & Cross Network (DCN) 和 xDeepFM，探讨它们在网络结构、特征交叉及优缺点。DCN通过Cross层显式构造高阶交叉特征，xDeepFM引入了FM的vector-wise思想到Cross部分，提升模型性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CTR 系列文章：

本篇文章讲解 CTR 经典模型 Deep & Cross (DCN) 与 xDeepFM，之所以把这两个模型放一起讲是因为它们有很近的“血缘关系”。理解了 DCN 的思想，再去理解 xDeepFM 就不觉得困难了。

以下文章对这两个模型的讲解很到位：

首先了解揭秘 Deep & Cross : 如何自动构造高阶交叉特征

推荐系统遇上深度学习(二十二)–DeepFM升级版XDeepFM模型强势来袭！

xDeepFM：名副其实的 ”Deep” Factorization Machine

因此，本文主要是对上述文章内容的梳理。

Deep & Cross (DCN)

首先来看看网络结构：

在这里插入图片描述

首先来看看网络的输入部分。元素特征需要做如下处理：

对sparse特征进行embedding，对于multi-hot的sparse特征，embedding之后再做一个简单的average pooling；
对dense特征归一化，然后和embedding特征拼接，作为随后Cross层与Deep层的共同输入：
$x_0 = [x^T_{embed, 1},x^T_{embed, 2},...x^T_{embed, k},x^T_{dense}]^T$

接下来看看 Cross 部分。

上图中模型的左半部分是包含了许多层的 Cross network，目标是以显式、可控、高效的方式自动构建有限高阶交叉特征。其中第 $l + 1$ 层的计算过程为：

在这里插入图片描述

$x_{l+1} = f(x_l, w_l, b_l)+x_l =x_0x^T_lw_l + b_l + x_l$
其中， $x_{l+1}, x_l, x_0$ 是 d 维向量。计算过程有两个特点：

输出神经元个数与输入网络的 $x_0$ 维度相同；
每一层的 $f$ 都是在拟合 $x_{l+1} - x_l$ 的残差，这样可以减缓梯度消失问题，使得网络更深。

为什么这么设计呢？先看一些计算的例子：

假设 Cross 网络有两层， $x_0 = [x_{0, 1} x_{0, 2}]^T$ ，为方便讨论令 $b_i = 0$ ，则有：

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。