推荐系统简介

最新推荐文章于 2020-05-21 18:15:11 发布

sam-X

最新推荐文章于 2020-05-21 18:15:11 发布

阅读量231

点赞数

CC 4.0 BY-SA版权

分类专栏：算法文章标签：推荐系统

本文链接：https://blog.youkuaiyun.com/u010945683/article/details/79571803

算法专栏收录该内容

15 篇文章

订阅专栏

本文详细介绍了推荐系统的评估方法，包括准确度指标如RMSE和MAE，Top-N推荐的精度和召回率，以及衡量系统覆盖率、多样性和新颖度等重要维度。同时探讨了推荐系统的主要类型和技术挑战。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

推荐系统评估

准确度
1. 打分系统
  设 $r_{ui}$ 为用户 $u$ 对物品 $i$ 的实际评分， $\hat r_{ui}$ 为预测分，有如下误差判定标准：
  
  $R M S E M A E = \sum u , i \in T ( r u i - r ^ u i ) 2 | T | - - - - - - - - - - - - - - - \sqrt = \sum u , i \in T | r u i - r ^ u i | | T | (371)$ $\begin{equation}\begin{split} RMSE & =\sqrt {{{\sum_{u,i\in T}( r_{ui}-\hat r_{ui})^2}\over{|T|}}}\nonumber\\ MAE & ={{\sum_{u,i\in T}|r_{ui}-\hat r_{ui}|}\over{|T|}}\nonumber \end{split}\end{equation}$
2. Top N推荐
  设 $R(u)$ 为根据训练建立的模型在测试集上的推荐， $T(u)$ 为测试集上用户的选择
  
  $P r e c i s i o n R e c a l l = \sum u \in U | R ( u ) \cap T ( u ) | \sum u \in U | R ( u ) | = \sum u \in U | R ( u ) \cap T ( u ) | \sum u \in U | T ( u ) | (372)$ $\begin{equation}\begin{split} Precision &= {{\sum_{u\in U}|R(u)\cap T(u)|}\over{\sum_{u\in U}|R(u)|}}\nonumber\\ Recall &= {{\sum_{u\in U}|R(u)\cap T(u)|}\over{\sum_{u\in U}|T(u)|}}\nonumber \end{split}\end{equation}$
覆盖率
表示对物品长尾的挖掘能力(针对平台商品而言)

$C o v e r a g e H = | U u \in U R ( u ) | | I | = - \sum i = 1 n p (i) log p (i) (373)$ $\begin{equation}\begin{split} Coverage &= {{|U_{u\in U}R(u)|}\over{|I|}}\\ H &= -\sum_{i=1}^np(i)\log p(i) \end{split}\end{equation}$
多样性
推荐结果列表中物品的丰富性(两两之间的差异性，面向用户)， $s(i,j)$ 表示物品 $i$ 和 $j$ 之间的相似度， $|R(u)|$ 表示集合元素数量(表示推荐给该 $u$ 用户的所用商品)，多样性表示如下：

$\begin{matrix} (374) & \begin{aligned} D i v e r s i t y (R (u)) & = 1 - \frac{\sum_{i, j \in R (u), i \neq j} s (i, j)}{\frac{1}{2} | R (u) | (| R (u) | - 1)} \\ D i v e r s i t y & = \frac{1}{| U |} \sum_{u \in U} D i v e r s i t y (R (u)) \end{aligned} \end{matrix}$ $\begin{equation}\begin{split} Diversity(R(u)) &= 1-{{\sum_{i,j\in R(u),i\neq j}s(i,j)}\over{{1\over 2}|R(u)|(|R(u)|-1)}}\\ Diversity &= {1\over |U|}\sum_{u\in U}Diversity(R(u)) \end{split}\end{equation}$
新颖度：商品给用户的新鲜感（推荐不知道的商品）
惊喜度：推荐和用户历史兴趣不相似却满意的
信任度：提供可靠的推荐理由
实时性：实时更新程度