【推荐系统】Factorization Machine

最新推荐文章于 2025-04-26 22:34:42 发布

shenxiaolu1984

最新推荐文章于 2025-04-26 22:34:42 发布

阅读量9k

点赞数 3

分类专栏：机器学习算法文章标签：算法推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/shenxiaolu1984/article/details/78740481

版权

Factorization Machine（FM）是推荐系统的重要算法，针对稀疏数据的挑战，通过分解方法降低参数量，有效防止过拟合。FM模型计算与求解效率高，线性时间复杂度使其易于优化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Factorization Machine（FM）¹是现代推荐系统的基础算法之一。本文介绍FM的模型思想、计算与优化方法。

FM模型

问题

输入： $n$ 维数据 $\bf{x}$ 。
预测：标量 $y$

举例

回归： $\bf x$ 的元素和 $y$ 都为实数

二类分类： $\bf x$ 的元素为实数， $y$ 为 $\pm1$

排序： $\textbf x =(x^a,x^b)$ 为有序对， $y$ 为 $\pm1$

在实际问题中， $\bf x$ 往往非常稀疏： $\bf x$ 中非零元素个数远远小于 $n$ 。

举例
一个电影推荐系统，系统中有 $n_1$ 个用户，有 $n_2$ 部电影。
系统中的每一条记录包含如下信息：用户编号，时间，电影编号，打分。
想要设计一个系统，预测用户某时刻对某一部电影的评分。

对于每一条记录，按照如下方式将其转化为 $(\textbf x,y)$ 对：
|-|内容|维度|说明|
|----|----|----|
| $\textbf x$ |1-hot编码的用户编号| $n_1$ |用户多，此部分稀疏|
||1-hot编码的电影编号| $n_2$ |电影多，此部分稀疏|
||0-1标记用户已经看过的电影，归一化到和为一| $n_2$ |大部分用户只看过很少电影，此部分稀疏|
||时间|1||
|y|评分|1||

稀疏数据的挑战

一个预测模型可以有不同的“度”(degree)，度越大，对 $\bf x$ 元素之间的相互作用考虑的越多。

$d = 1$ 时，是线性模型：
$y(\textbf x)=\sum_{i=1}^nw_ix_i$
$d = 2$ 时，考虑元素对之间的关系：
$y(\textbf x)=\sum_{i=1}^nw^1_ix_i+\sum_{i=1}^n\sum_{j=i+1}^nw^2_{ij}x_ix_j$

注意第二项，下标j的循环从i+1开始。

$d = 3$ 时，考虑三元组之间的关系：

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。