【推荐系统】FM,FFM,AFM的简要介绍

本文介绍了CTR预估的重要性和常用方法,如LR、GBDT+LR、FM和FFM。重点讲解了FM的特征组合、辅助向量以及FFM的field概念,对比了FFM与FM的优缺点。最后,提到了AFM模型,它通过attention机制改进了FM的特征交互效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CTR

Click-through rate (CTR) is the ratio of users who click on a specific
link to the number of total users who view a page, email, or
advertisement. It is commonly used to measure the success of an online
advertising campaign for a particular website as well as the
effectiveness of email campaigns.

在计算广告和推荐系统中,CTR预估(click-through rate)是非常重要的一个环节,判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。准确的估计CTR对于提高流量的价值,增加广告收入有重要的指导作用。在进行CTR预估时,除了单特征外,往往要对特征进行组合。预估CTR,业界常用的方法有人工特征工程 + LR(Logistic Regression)、GBDT(Gradient Boosting Decision Tree) + LR、FM(Factorization Machine)和 FFM(Field-aware Factorization Machine)模型。在这些模型中,FM和FFM近年来表现突出,分别在由Criteo和Avazu举办的CTR预测竞赛中夺得冠军

FM

FM(Factorization Machine)主要是为了解决数据稀疏的情况下,特征怎样组合的问题。

线性回归

在传统的线性回归模型中,对于一个给定的特征向量X=(x1,x2,…,xn)TX=(x_1,x_2,…,x_n)^TX=(x1,x2,,xn)T,线性回归建模时采用的函数是

y^(x)=w0+w1x1+w2x2+...+wnxn=w0+∑i=1nwixi \hat{y}(x) = w_0+w_1x_1+w_2x_2+...+w_nx_n\\ =w_0+\sum_{i=1}^nw_ix_i y^(x)=w0+w1x1+w2x2+...+wnxn=w0+i=1nwixi

可以看出,各特征分量xix_ixixjx_jxj之间是相互孤立的,即y^(x)\hat{y}(x)y^(x)中仅考虑单个的特征分量,而没有考虑特征分量之间的相互关系(interaction)

特征组合

所以,我们可以把函数y^\hat{y}y^改写成
y^(x)=w0+∑i=1nwixi+∑i=1n−1∑j=i+1nwijxixj \hat{y}(x) =w_0+\sum_{i=1}^nw_ix_i+\sum_{i=1}^{n-1}\sum_{j=i+1}^{n}w_{ij}x_ix_j y

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值