CFFNN: Cross Feature Fusion Neural Network for Collaborative Filtering 阅读笔记

最新推荐文章于 2024-12-30 20:48:16 发布

八宝袋

最新推荐文章于 2024-12-30 20:48:16 发布

阅读量428

点赞数

CC 4.0 BY-SA版权

分类专栏：周报调研推荐系统文章标签：机器学习 python 人工智能

本文链接：https://blog.youkuaiyun.com/weixin_44569973/article/details/126028705

推荐系统同时被 3 个专栏收录

13 篇文章

订阅专栏

调研

10 篇文章

订阅专栏

周报

3 篇文章

订阅专栏

CFFNN（CrossFeatureFusionNeuralNetwork）是一种应用于协同过滤的深度学习模型。该模型包括输入层、特征提取层、特征融合层和预测层。输入层使用One-hot向量化并结合投影矩阵。特征提取层通过多个单层全连接网络（MLP）进行特征提取，并将输出拼接。尽管DNN可能导致过拟合，但作者选择MLP以避免核函数选择的困难。特征融合层利用横向和纵向注意力机制进行特征融合。预测层再次应用注意力机制以生成预测值。尽管模型复杂，但对于理解用户和项目特征的融合有一定贡献。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CFFNN: Cross Feature Fusion Neural Network for Collaborative Filtering

摘要

方法

1. 符号系统

$I,Y\in R^{M\times N}$ :用户、项目、交互集合，M和N分别是用户、项目的总数.

2. 输入层

把One-hot向量化的层，很少有把这一步写出来的，用了P, Q两个投影矩阵，结果是 $e_u,e_i$ . 分别代表用户、项目。

3. 特征提取层

这一层真是有点…
在这里插入图片描述
如图所示，在Embedding层后，有m个小方块，每一个小方块其实都是一个单层全连接的输出，然后Concat把m个输出拼起来，得到这一层的输出 $F_u$ , 类似地，项目方面得到 $F_i$ .

关于为什么不用deep网络结构而是用wide结构，作者的解释是：首先，DNN容易过拟合，难传播梯度；其次，不同数量的MLP可以捕捉不同的特征，可以提高模型性能【对这点存疑，因为毕竟是黑盒，单纯地横向拼接缺乏可解释性】。
MLP的优点：上述结构在CV中很常用，但是难点是选择合适的核尺寸，但是MLP就没有核函数的存在，所以可以用不同数量的MLP来替换核函数。