召回率与准确率

转自 这里

纠正下,精确率(precision)和准确率(accuracy)是不一样的,题主问的应该是精确率与召回率之间的差别。



一.定义辨析

刚开始接触这两个概念的时候总搞混,时间一长就记不清了。


实际上非常简单, 精确率是针对我们 预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP),也就是
P  = \frac{TP}{TP+FP}
召回率是针对我们原来的 样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN)。
R = \frac{TP}{TP+FN}
其实就是分母不同,一个分母是预测为正的样本数,另一个是原来样本中所有的正样本数。

在信息检索领域,精确率和召回率又被称为 在信息检索领域,精确率和召回率又被称为 查准率查全率

查准率=检索出的相关信息量 / 检索出的信息总量
查全率=检索出的相关信息量 / 系统中的相关信息总量

二.举个栗子

假设我们手上有60个正样本,40个负样本,我们要找出所有的正样本,系统查找出50个,其中只有40个是真正的正样本,计算上述各指标。

  • TP: 将正类预测为正类数 40
  • FN: 将正类预测为负类数 20
  • FP: 将负类预测为正类数 10
  • TN: 将负类预测为负类数 30

准确率(accuracy) = 预测对的/所有 = (TP+TN)/(TP+FN+FP+TN) = 70%
精确率(precision) = TP/(TP+FP) = 80%
召回率(recall) = TP/(TP+FN) = 2/3
### 关于召回率准确率的例题练习 #### 召回率(Recall) 召回率是指模型能够正确识别出的所有正类样本占实际正类样本的比例。其计算公式如下: \[ \text{召回率} = \frac{\text{真正例 (TP)}}{\text{真正例 (TP)} + \text{假反例 (FN)}} \] #### 准确率(Accuracy) 准确率是指模型预测正确的总样本数占全部样本数的比例。其计算公式如下: \[ \text{准确率} = \frac{\text{真正例 (TP)} + \text{真反例 (TN)}}{\text{真正例 (TP)} + \text{假正例 (FP)} + \text{假反例 (FN)} + \text{真反例 (TN)}} \] 以下是几个具体的例子供参考: --- #### **例题 1** 假设有一个二分类问题,混淆矩阵如下所示: ```plaintext [[7, 3], [2, 8]] ``` - 真正例 (TP) = 8 - 假正例 (FP) = 3 - 假反例 (FN) = 2 - 真反例 (TN) = 7 **计算:** 1. **召回率** \[ \text{召回率} = \frac{\text{TP}}{\text{TP} + \text{FN}} = \frac{8}{8 + 2} = 0.8 \][^1] 2. **准确率** \[ \text{准确率} = \frac{\text{TP} + \text{TN}}{\text{TP} + \text{FP} + \text{FN} + \text{TN}} = \frac{8 + 7}{8 + 3 + 2 + 7} = 0.85 \][^4] --- #### **例题 2** 某垃圾邮件检测系统的测试结果显示以下数据: - 正常邮件总数:90 条 - 垃圾邮件总数:10 条 - 被错误标记为正常邮件的垃圾邮件数量:2 条 - 被错误标记为垃圾邮件的正常邮件数量:3 条 构建混淆矩阵并计算召回率准确率。 **解答:** 1. 构建混淆矩阵: ```plaintext [[87, 3], # 正常邮件被正确分类的数量 vs 错误分类为垃圾邮件的数量 [2, 8]] # 垃圾邮件被错误分类为正常邮件的数量 vs 正确分类为垃圾邮件的数量 ``` 2. **召回率** \[ \text{召回率} = \frac{\text{TP}}{\text{TP} + \text{FN}} = \frac{8}{8 + 2} = 0.8 \] 3. **准确率** \[ \text{准确率} = \frac{\text{TP} + \text{TN}}{\text{TP} + \text{FP} + \text{FN} + \text{TN}} = \frac{8 + 87}{8 + 3 + 2 + 87} = 0.93 \][^4] --- #### **例题 3** 给定一组预测结果及其真实标签如下表所示: | 实际值 | 预测值 | |--------|--------| | 1 | 1 | | 1 | 0 | | 0 | 1 | | 1 | 1 | | 0 | 0 | 其中,“1”表示正类,“0”表示负类。 **计算:** 1. 混淆矩阵: ```plaintext [[2, 1], # TN, FP [1, 2]] # FN, TP ``` 2. **召回率** \[ \text{召回率} = \frac{\text{TP}}{\text{TP} + \text{FN}} = \frac{2}{2 + 1} = 0.6667 \] 3. **准确率** \[ \text{准确率} = \frac{\text{TP} + \text{TN}}{\text{TP} + \text{FP} + \text{FN} + \text{TN}} = \frac{2 + 2}{2 + 1 + 1 + 2} = 0.75 \] --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值