机器学习项目(五) 电影推荐系统(六)FM FFM

本文介绍了FM(Factorization Machines)和FFM(Field Factorization Machine)在电影推荐系统中的作用。FM是一种自动组合特征的模型,能够处理稀疏数据,而FFM引入了field概念,更细致地考虑特征间的关系。离散化和one-hot编码是处理特征的重要手段,文章提到了连续性特征离散化的优点和方法。最后,提到了使用xlearn库进行FFM模型训练的链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

FM&FFM

特征类型

1.连续性特征:统计特征、用户对商品的偏好分、搜索词和文本相似度等
2.离散型特征:用户ID、性别、省份、商品ID、品牌ID、品类ID等

连续性特征离散化

1.连续性特征离散化优点:
离散化后的特征对异常数据有很强的鲁棒性
特征离散化后,模型会更稳定
2.连续性特征离散化的方法:
分桶法:等宽分桶、等频分桶
树模型分桶:借助树模型分桶

离散型特征:

one-hot编码:
hash trick

MF(Matrix Factorization)

在这里插入图片描述
min ⁡ p , q L ( p , q ) = ∑ ( u , i ) ∈ K ( r u i − r ^ u i ) 2 + λ ( ∥ p u ∥ 2 + ∥ q i ∥ 2 ) \min _{p, q} L(p, q)=\sum_{(u, i) \in K}\left(r_{u i}-\hat{r}_{u i}\right)^{2}+\lambda\left(\left\|p_{u}\right\|^{2}+\left\|q_{i}\right\|^{2}\right) p,qminL(p,q)=(u,i)K(ruir^ui)2+λ(pu2+

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值