推荐系统排序（Rank）评价指标总结

最新推荐文章于 2025-06-28 23:53:15 发布

原创最新推荐文章于 2025-06-28 23:53:15 发布 · 2.5w 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#信息检索 #推荐系统 #Rank

推荐系统同时被 2 个专栏收录

21 篇文章

订阅专栏

信息检索

1 篇文章

订阅专栏

本文详细介绍了信息检索领域中常见的评估指标，包括Mean Average Precision (MAP)、Mean Reciprocal Rank (MRR)、Normalized Discounted Cumulative Gain (nDCG)以及Kendall tau distance等，并通过实例说明了这些指标的计算方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.Mean Average Precision (MAP)

$AP= \dfrac{\sum_{j=1}^{n_i}P(j).y_{i,j}}{\sum_{j=1}^{n_i}y_{i,j}}$
其中，
$y_{i,j}$ :排序中第j个元素对于查询i是否是相关的；相关为1，不相关为0。
$P(j)=\dfrac{\sum_{k:\pi_i(k)\le\pi_i(j)}y_(i,k)}{\pi_i(j)}$
其中，
$\pi_i(j)$ 为j的排序位置。

例如，
rank_no 是否相关
1 1
2 0
3 1
4 0
5 1
6 0
则根据AP计算公式：
AP = (1*1 + (1/2) *0+ (2/3)*1 + (2/4)*0 + (3/5)*0 + (3/6)*0) /3 = …

举例，第一项，P(1) = 它前面的项（包括自己）相关的个数除所在排序的位置（也就是1）。第一位及前面（前面没有）相关的个数就是它本身，所以P()的分子就是1，分母也是1.所以取值为1。同时y值为1.最终的对应AP中的项就是1
其他以此类推。
AP的最大值为1（也就是当相关的全部排在不相关的前面的时候）
MAP就是对所有query的AP求平均。

2.Mean Reciprocal Rank (MRR)

这里写图片描述
其中|Q|是查询个数，ranki是第i个查询，第一个相关的结果所在的排列位置。
举例：

对于三个查询，每个查询的ranki分别为3、2、1。所以，
$MRR = 1/3*(1/3+1/2+1/1)$
(参考自Wikipedia)

3.NDCG

首先是DCG的定义：
这里写图片描述

其中，
$rel_i$ 为排在第i个位置的物品实际的评价分值（也就是和查询相关的程度)
举例：
这里写图片描述
所以：

理想的DCG,也就是排序是最理想的情况（3，3，2，2，1，0）：
这里写图片描述

最终的NDCG为：
这里写图片描述
(参考自Wikipedia)
以上是信息检索中常用的nDCG指标。考虑推荐中(二值评分–0，1）的情况。参考文献【1】中，给出了更适合的描述（实际定义都是一样。只是上面描述时，评分是连续的分值；而【1】中的描述考虑的是[0,1]分值）：
这里写图片描述

4.Kendall tau distance

也就是两个排序间，评价存在分歧的对的数量。具体定义如下：
这里写图片描述
其中， $\tau _{1}(i)$ 和 $\tau _{2}(i)$ 分别为元素i在两个排序中的序位
如果两个排序完全一样。则Kendall tau distance位0。否则，如果两个排序完全相反，则为 $n(n-1)/2$ 。
通常 Kendall tau distance都会通过除以 $n(n-1)/2$ 来归一化。

举例：
这里写图片描述

这里写图片描述

从中可以看出有4个元素对在两个排序中存在分歧。所以归一化后的Kendall tau distance为：
这里写图片描述
(参考自Wikipedia)
此外，参考文献【1】中也有这个指标的介绍。略有不同，下面直接截取供大家参考：

5、Spearman’s ρ （斯皮尔曼的ρ） $^{[1]}$
基本思想类似Kendall tau distance：比较两个排序（通常一个是理想排序）的（排序值的）皮尔逊相关系数。
比如在推荐中，一个推荐排序列表采用物品实际的评分值（用户实际的偏好程度）排序。一个是你的模型对物品的实际排序。 $s^*_{i,j}$ 表示你模型预测中，物品j在用户i的推荐列表上的排序位置； $y^*_{i,j}$ 表示按实际用户i对物品的评分来排序时物品j在i的推荐列表上的排序位置。 $\bar s^*$ 表示 $s^*_{i,j}$ 的平均值； $\bar y^*$ 表示 $y^*_{i,j}$ 的平均值.。则：
这里写图片描述
其中 $Ω^{test}$ 为测试集