Factorization Machine 学习笔记

最新推荐文章于 2024-04-15 16:41:28 发布

原创最新推荐文章于 2024-04-15 16:41:28 发布 · 251 阅读

0 ·

CC 4.0 BY-SA版权

建模专栏收录该内容

2 篇文章

订阅专栏

FM模型有效解决特征稀疏和组合问题，适用于多种场景，训练速度快，复杂度低。相较于线性回归，FM通过引入向量Vi改善了特征组合的考虑，避免了高复杂度和训练不足的问题。

FM 的优点：

解决了特征稀疏的问题，能在非常系数数据的情况下进行预估。
解决了特征组合的问题，研究了特征与特征之间的向量，不像LR线性回归那样没有组合
FM使一个通用模型，适用于大部分场景，而其他因式分解模型只能用于一些输入数据比较固定的情况
训练速度快，线性复杂度是线性的，优化效果很好

一般的线性回归：
在这里插入图片描述
考虑了特征组合：

缺点：复杂度太高，复杂度n^2，wij只能在xi，xj不同时为0的情况下训练，特征稀疏的情况下，大多数情况下xi，xj大多数情况下为0，训练不充分

FM的推导：
引入一个变量 $V_i$ ，让 $V_i$ 等于
$V_i = (v_{i1},v_{i2},v_{i3},...,v_{ik})^T$
所以当 i =1或者n时：
$V_1 = (v_{11},v_{12},v_{13},...,v_{1k})^T$
$V_n = (v_{n1},v_{n2},v_{n3},...,v_{nk})^T$
已知 $w_{ij}$ 可以组成一个矩阵：
$\begin{bmatrix} w_{11} & w_{12}& ... & w_{1n}\\ w_{21} & w_{22}& ... & w_{2n}\\ \vdots & \vdots& \ddots & \vdots\\ w_{n1} & w_{n2}& ...& w_{nn} \end{bmatrix} _{nn}$
而 $V_i$ 组成一个矩阵 $V$ ：
$\begin{bmatrix} {V_{1}}^T\\ {V_{2}}^T\\\ \vdots\\ {V_{n}}^T\\ \end{bmatrix} = \begin{bmatrix} v_{11} & v_{12}& ... & v_{1k}\\ v_{21} & v_{22}& ... & v_{2k}\\ \vdots & \vdots& \ddots & \vdots\\ v_{n1} & v_{n2}& ...& v_{nk} \end{bmatrix} _{nk}$
所以可以有 $VV^T = W$