准确率、召回率、F-score——信息检索、分类、推荐系统评估标准

本文介绍了在分类和推荐系统中常用的评估指标,包括准确率、召回率及F-score,并解释了这些指标的含义及其应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在分类和推荐系统中,对其结果进行评价,经常用到准确率、召回率、F-score这些指标。

下面介绍其概念,举例阐述。


准确率(Precision):检索出的相关文档/检索出的文档总数,衡量的是系统的查准率。

召回率(Recall):检索出的相关文档/文档中所有相关文档总数,衡量的是系统的查全率。

F-score是两者的综合评价标准:


准确率和召回率的取值范围都在[0,1],越高越好。

具体准确率和召回率的定义,见下图。



两者一般存在矛盾关系,不能都达到很高的值,所以定义F-score评价综合标准。


参考文章
1、http://bookshadow.com/weblog/2014/06/10/precision-recall-f-measure/

2、http://www.360doc.com/content/14/0823/10/13518188_403996763.shtml

### 图像处理中的准确率召回率 #### 准确率 (Precision) 准确率是指预测为正类的样本中实际为正类的比例。具体来说,在图像分类任务中,如果一个模型识别出某些图像是某个特定类别,则这些被标记为此类别的图像中有多少确实是该类别。 \[ \text{Precision} = \frac{\text{True Positives}}{\text{True Positives} + \text{False Positives}} \][^1] 对于图像处理而言,这意味着当系统检测到某张图片属于某一类别时,它确实属于这一类的概率有多大。 #### 召回率 (Recall) 召回率衡量的是所有真实为正类的样本中有多少比例被成功检索出来。换句话说,就是指在所有的目标对象里有多少能够被正确地找出来的能力。 \[ \text{Recall} = \frac{\text{True Positives}}{\text{True Positives} + \text{False Negatives}} \][^2] 应用于图像领域内,比如面部识别或物体检测场景下,这表示真正存在的面孔或其他指定特征能多大程度上不漏网地被捕获到。 #### 应用实例 在一个医疗影像分析的应用案例中: - **高精度**意味着很少有健康人的扫描结果错误地标记成患病者; - **高召回率**则确保尽可能多地发现真正的病患而不遗漏任何可能的情况。 因此,根据不同应用场景的需求可以选择侧重于提高其中一个度量标准或是寻求两者之间的平衡点——即通过调整决策阈值来优化性能表现。 #### 主要区别 主要差异在于关注的重点不同:准确率更关心减少误报(将负例错判为正),而召回率强调降低漏检风险(未能识别真实的正)。这两方面往往存在一定的矛盾关系;通常情况下增加一方可能会导致另一方下降。为了综合评估系统的整体效能,可以采用 F1-score 这样的复合指标来进行考量。 ```python def calculate_precision(true_positives, false_positives): """Calculate precision.""" try: return true_positives / (true_positives + false_positives) except ZeroDivisionError: return 0.0 def calculate_recall(true_positives, false_negatives): """Calculate recall.""" try: return true_positives / (true_positives + false_negatives) except ZeroDivisionError: return 0.0 ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值