推荐系统——基于邻域的推荐方法综述

最新推荐文章于 2023-05-10 17:30:25 发布

原创

最新推荐文章于 2023-05-10 17:30:25 发布 · 557 阅读

2 ·

CC 4.0 BY-SA版权

本文详细介绍了基于邻域的推荐方法，包括基于用户的评分预测和基于物品的推荐，讨论了评分预测的回归与分类、相似度权重计算、邻域选择等问题。针对预测准确性、效率、稳定性和惊喜度等方面进行了比较，并提到了基于图和学习的进阶技术，以克服邻域方法的局限性。

文章目录

2.1 简介

百度脑图

2.2 问题定义和符号

1.基本符号定义

1.用户集合： $\mathcal{U} \Rightarrow u \in \mathcal{U}$
- $\mathcal{U}_i \Rightarrow$ 表示集合中已经对物品 $i$ 进行了评分的用户集合
- $\mathcal{U}_{ij} = \mathcal{U}_{i} \bigcap \mathcal{U}_{j} \Rightarrow$ 表示同时对物品 $i$ 和 $j$ 都进行了评分的用户集合
2.物品集合： $\mathcal{I} \Rightarrow i \in \mathcal{I}$
- $\mathcal{I} _u \Rightarrow$ 表示被用户 $u$ 所评分的物品集合
- $\mathcal{I} _{uv} = \mathcal{I} _{u} \bigcap \mathcal{I} _{v} \Rightarrow$ 表示被同时被用户 $u$ 和 $v$ 所评分的物品集合
3.系统评分可选的分数集合： $\mathcal{S}$
- 例如： $\mathcal{S} = \{喜欢,不喜欢 \}$
4.系统评分集合： $\mathcal{R}$
- $r_{ui} \in \mathcal{R}\Rightarrow$ 表示用户 $\in \mathcal{U}$ 对于特定物品 $\in \mathcal{I}$ 的评分
- 同时假定 $r_{ui}$ 的取值个数不能多于一个（要么一个取值要么没有）

2.评分预测(rating prediction)

为了预测某个用户对他未评价过的物品 $i$ 的评分。
当评分存在时，这个任务通常可以定义为一个回归或者分类（多类）的问题，其目标是用学习函数：
$\mathcal{U \times \mathcal{I} \to S}$ 来预测用户 $u$ 对于新物品 $i$ 的评分 $f (u, i)$
评分集合 $\mathcal{R}$ 可以分为 $\mathcal{R}_{train}$ 和 $\mathcal{R}_{test}$

评估预测准确性的标准：

平均绝对误差（Mean Absolute Error）：能更好地反映预测值误差的实际情况.
$\frac{1} {|\mathcal{R}_{test}|} \sum_{r_{ui} \, \in \mathcal{R}_{test}} |f(u,i)-i_{ui}|$

均方根误差（Root Mean Square Error）：是用来衡量观测值同真值之间的偏差
$\sqrt{ \frac{1} {|\mathcal{R}_{test}|} \sum_{r_{ui} \, \in \mathcal{R}_{test}} (f(u,i)-i_{ui})^2}$

最低0.47元/天解锁文章