个人总结：推荐算法从MF(LFM) 到 FM FFM Wide&Deep DeepFM

最新推荐文章于 2025-03-20 09:03:02 发布

yyhhlancelot

最新推荐文章于 2025-03-20 09:03:02 发布

阅读量6.4k

点赞数 5

分类专栏：推荐系统文章标签：推荐系统 FM 机器学习

本文链接：https://blog.youkuaiyun.com/yyhhlancelot/article/details/99231462

版权

FM

在推荐系统中，经常会碰到电影评分这样高度稀疏的数据，在之前的个人总结：推荐算法篇（附协同过滤等）综述的基于模型的协同过滤中，提到了FunkSVD(LFM，Latent Factor Model)，通过设置隐含特征，进行矩阵分解，来实现对未知评分的预测。这里FM，和LFM一样，也是隐变量模型。

问题背景

传统逻辑回归认为特征直接是相互独立的，但是很多情况下特征之间的依赖关系不可忽视，因此需进行特征组合，但是大多数业务场景下，类别特征做完onehot后会变得非常稀疏，尤其是特征组合后，特征空间变得很大，而FM就是为了解决特征组合下数据稀疏所带来的问题。

由线性回归说起

一般的线性模型定义如下，很直观可以看出特征均单独出现。

引入二阶多项式，可以引入特征之间的依赖关系

二阶特征的参数共有n(n - 1)/2种，且任意参数间相互独立，并且在进行参数估计时发现，对于这些二次项的参数，都需要大量的非零样本来进行求解，但是很多时候特征空间是相当稀疏的，这种情况下参数的估计值变得相当不准确。

二阶FM原理

FM引入矩阵分解的思路，对交叉项的系数矩阵进行了如下分解：

这个分解的思想是：由于特征之间不是相互独立的，因此可以使用一个隐因子来串联，类似于推荐算法中将一个打分矩阵分解为user矩阵和item矩阵，也就是前面提到的FunkSVD(LFM，Latent Factor Model)，每个user和item都可以用一个隐向量来表示，
FM采用类似思想，将所有二次项系数组成为一个对称矩阵W，W可被分解为V^T*V