推荐系统学习笔记

原创于 2021-11-02 19:27:45 发布 · 310 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #人工智能 #推荐系统

推荐系统专栏收录该内容

2 篇文章

订阅专栏

本文介绍了推荐系统从传统模型到深度学习模型的发展历程，并详细探讨了协同过滤、矩阵分解、逻辑回归等经典方法及其优缺点。同时，针对推荐系统的业务关键问题如冷启动、数据稀疏等进行了讨论。

一、传统模型演进史

1. 协同过滤(CF)

利用user-item交互矩阵（m x n维，一般用户数m远大于商品数n），生成user向量和item向量。

UserCF
- 通过当前用户topk相似用户对待预测商品的评分加权平均得到，具有社交性、适合热点追踪。
- 需要维护 $m^2$ 级别的用户相似度矩阵。
- 用户的购买历史数据大多稀疏，因此用户相似度计算不可靠。
ItemCF:
- 通过当前用户最喜爱topk的商品，搜索其他相似商品，生成推荐列表。具有明显的兴趣类别特征。

2. 矩阵分解(MF)

业务数据为交互矩阵 $Dm×nD_{m\times n}$ 。注意消除打分偏差（用户给分偏好、评分体系均值等）

特征值分解：仅用于方阵，无法用于推荐
奇异值分解：要求原始矩阵稠密、计算复杂度高
梯度下降：目标函数为使user向量 $pu\boldsymbol p_u$ 和item向量 $qu\boldsymbol q_u$ 点积尽可能逼近对应的交互评分 $r_{ui}$
$minq,p∑(rui−qi⋅pu)+λ(∣∣qi∣∣+∣∣pi∣∣)2min_{\boldsymbol{q,p}} \sum(r_{ui} - \boldsymbol q_i\cdot \boldsymbol p_u) + \lambda(||\boldsymbol q_i|| + ||\boldsymbol p_i||)^2$

3. 逻辑回归(LR)

步骤：
1. 将用户特征转换成数值向量
2. 确定优化目标（点击率、购买率）
3. 训练、预测排序
公式：
$f(x)=11+e−(w⋅x+b)f(\boldsymbol x)=\frac{1}{1+e^{-(\boldsymbol{w\cdot x} + b)}}$
$max⁡w(f(x))y(1−f(x))1−y\argmax_{\boldsymbol w}(f(\boldsymbol x))^y(1-f(\boldsymbol x))^{1-y}$
缺点：无法进行自动特征交叉、筛选等操作。存在辛普森悖论。

4. 特征交叉模型（POLY2、FM、FFM）

POLY2
$POLY2(w,x)=∑j1=1n∑j2=j1+1nwh(j1,j2)x1x2POLY2(\pmb w, \pmb{x})=\sum^n_{j_1=1}\sum^n_{j_2=j_1+1}\pmb{w}_h(j_1,j_2)\pmb{x_1}\pmb{x_2}$
FM
FFM

5. 集成学习模型(GBDT+LR)

6. 分段线性模型（LS-PLM）

通过聚类分片，在不同分段类使用LR, 实现整体上的非线性

二、深度学习模型演进史

三、业务关键问题

2.1 冷启动

2.2 数据稀疏

2.3

QA

POLY2算法中，两个特征交叉为什么可以直接用乘法？与后深度学习中的各类向量乘法有什么关系？

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。