【机器学习】排序问题（Ranking）中使用的指标及示例代码

最新推荐文章于 2025-05-01 15:30:00 发布

LogM

最新推荐文章于 2025-05-01 15:30:00 发布

阅读量1.2k

点赞数

分类专栏：机器学习

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.youkuaiyun.com/qq_28739605/article/details/104212487

版权

本文介绍了机器学习中用于评估排序问题的四个关键指标：P@K（Precision at K）、MAP（Mean Average Precision）、MRR（Mean Reciprocal Rank）和NDCG（Normalized Discounted Cumulative Gain）。通过实例解释了每个指标的计算方法和应用场景，帮助理解排序模型的性能评估。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者：LogM

本文原载于 https://segmentfault.com/u/logm/articles ，不允许转载~

1. P@K

P@K，代表前 K 个预测值中有多少的准确率 (Precision)。

比如，一个模型输出了一组排序，其输出的好坏依次为：好、坏、好、坏、好。

那么，

Prec@3 = 2/3

Prec@4 = 2/4

Prec@5 = 3/5

def precision(gt, pred, K):
    """ Computes the average precision.
        gt: list, ground truth, all relevant docs' index
        pred: list, prediction
    """
    hit_num = len(gt & set(pred[:K]))
    return float(1.0 * hit_num / K)