NFM(Neural Factorization Machines)：模型原理及pytorch代码实现

原创

已于 2022-09-14 20:13:57 修改 · 3k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #推荐算法 #pytorch #深度学习

于 2022-09-14 11:11:05 首次发布

一、前言

FM已经公认是稀疏数据预测中最有效的嵌入方法之一，真实世界中的数据往往是非线性且内部结构复杂，而FM虽然能够比较好的处理稀疏数据，也能学习稀疏数据间的二阶交互，但说白了，这个还是个线性模型，且交互仅仅限于二阶交互，所以作者认为，FM在处理真实数据的时候，表达能力并不是太好。

NFM这里同样是有着组合的味道，但是人家不是那么简单的拼接式组合了，而是设计了一种结构，NFM的核心创新点是Bi-Interaction池化部分来代替其他模型使用的拼接。把FM和DNN拼接了起来。这样一来同样是利用了FM和DNN的优势。

二、NFM模型介绍

改进的思路就是用一个表达能力更强的函数来替代原FM中二阶隐向量内积的部分。

而这个表达能力更强的函数呢，我们很容易就可以想到神经网络来充当，因为神经网络理论上可以拟合任何复杂能力的函数，所以作者真的就把这个f (x)换成了一个神经网络，当然不是一个简单的DNN，而是依然底层考虑了交叉，然后高层使用的DNN网络，这个也就是我们最终的NFM网络了：

1、Input和Embedding层

输入层的特征，文章指定了稀疏离散特征居多，这种特征我们也知道一般是先one-hot, 然后会通过embedding，处理成稠密低维的。这个地方真正实现的时候，往往先LabelEncoder一下(而不是one-hot encoder)，这样就直接能够得到那些取值非0的特征对应的embedding向量了，毕竟LabelEncoder一下就相当于为某个特征的所有取值建立了一个字典，我们知道在取某个值的embedding向量的时候，直接去字典的索引值就好了(one-hot Encoder * 嵌入矩阵其实也是取得为1的那个值，就是索引值其实）