FFM:Field-aware Factorization Machines for CTR Prediction简介

摘要

FM被广泛应用在CTR,但是FFM在一些世界范围的CTR竞赛表现好于目前存在的模型。作者实现了相关代码,并与一些竞争模型进行了全面的分析。实验证明FFM在某些分类问题上非常有用。

介绍

FFM

在这里插入图片描述

对于这个例子来说,FM的隐向量表示应该为:
在这里插入图片描述

在FM中,每个特征只有一个隐向量来学习隐性的影响。拿ESPN来做例子, w E S P N w_{ESPN} wESPN被用来学习隐性的与Nike和Male的影响,但是因为Nike和Male是属于不同的领域的,那么使用同一个 w E S P N w_{ESPN} wESPN可能不太合适。

在FFM中,每个特征都有一些隐性的向量,取决于其他特征的所属领域。比如对于上述例子,FFM的隐向量表示为:

在这里插入图片描述

所以其数学模型为:
在这里插入图片描述

在这里插入图片描述

整个算法步骤:
在这里插入图片描述

优化

使用AdaGrad优化方法,自适应优化学习速率,对频繁变化的参数以更小的步长进行更新,而稀疏的参数以更大的步长进行更新。

梯度:
在这里插入图片描述

AdaGrad:
在这里插入图片描述

G的初始值为1,避免分母为0,过大

缺陷

在这里插入图片描述

仅针对二次项,FM有nk个参数,而FFM有nfk个参数。而且FFM无法利用化简,所以计算复杂度为 O ( k n 2 ) O(kn^2) O(kn2).所以这需要较大的硬件资源来提供运算。

Impact of Parameter

  • k值不需要太大,没有什么提升

    在这里插入图片描述

  • λ \lambda λ α \alpha α需要着重调整

    在这里插入图片描述

Early Stopping

防止过拟合

在这里插入图片描述
可以参考我的github来看看源代码,如有错误,欢迎交流。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值