通俗解释机器学习中的召回率、精确率、准确率

文章讨论了精确率和召回率在预测模型中的重要性,通过地震预测和人脸识别支付的例子说明,在不同场景下如何选择提升精确率或召回率。精确率关注正确预测的正样本占比,避免误报,而召回率关注预测到所有正样本的能力,防止漏报。在高风险决策中,如地震预测,提高召回率更为关键;而在人脸识别支付等场景,提高精确率以减少误检更为重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

赶时间的同学们看这里:提升精确率是为了不错报、提升召回率是为了不漏报

在这里插入图片描述

网络上很多地方分不清准确率和精确率,在这里先正确区分一下精确率和准确率,以及他们的别称
在这里插入图片描述

切入正题

很多人分不清召回率和精确率的区别,即使记住了公式,过段时间还是会忘掉,这里我会完全讲清楚这几个率的区别

准确率很好理解,被正确预测出来的数量 / 所有的样本,这里不在赘述,主要讲解精确率和召回率

目标检测性能指标

在这里插入图片描述

  • 精确率(Precision)= 系统检索到的相关文件 / 系统所有检索到的文件总数

  • 召回率(Recall)= 系统检索到的相关文件 / 系统所有相关的文件总数

  • F1-score: 将precision 和recall合成一个指标,越大越好

  • IOU 即交并比 即 Intersection-over-Union,是目标检测中使用的一个概念,是一种测量在特定数据集中检测相应物体准确度的一个标准。

  • mAP 即 Mean Average Precision即平均AP值,是对多个验证集个体求平均AP值,作为 object dection中衡量检测精度的指标。

  • P-R曲线即 以 precision 和 recall 作为 纵、横轴坐标 的二维曲线。通过选取不同阈值时对应的精度和召回率画出。总体趋势,精度越高,召回越低,当召回达到1时,对应概率分数最低的正样本,这个时候正样本数量除以所有大于等于该阈值的样本数量就是最低的精度值。

  • AP(average precision)——P-R曲线下的面积;通常来说一个越好的分类器,AP值越高

  • Fps(Frames Per Second):每秒处理图像的帧数

  • FLOPS:每秒浮点运算次数、每秒峰值速度

精确率和召回率就是分母不一样,下面以预测地震为例

请听题:你的老板让你做一个地震预测模型(以天为单位记某一天地震为正样本,不地震为负样本),你需要预测接下来100天的地震情况。

假设你是拉普拉斯妖,你知道第50天和51天会地震,其余的1-49和51-100天不会地震。

现在假设你的模型已经做好,但是不能精确率和召回率,二者不可得兼,摆在你面前的是提升其中的一个率,你应该怎么办?

通俗解释一下

咋一看他们只有分母不一样,但是为啥不一样呢?

精确率: 分母是预测到的正类,精确率的提出是让模型的现有预测结果尽可能不出错(宁愿漏检,也不能让现有的预测有错)

以地震模型为例说就是宁愿地震了没报,也不能误报地震,比如说为了不错报,只预测了第50天可能发生地震,此时的

1.精确率:1/1=100%

2.召回率:1/2=50%

虽然有一次地震没预测到,但是我们做出的预测都是对的。

召回率: 分母是原本的正类,召回率的提出是让模型预测到所有想被预测到的样本(就算多预测一些错的,也能接受)

以地震模型为例说这100次地震,比如说为了不漏报,预测了第30天、50天、51天、70天、85天地震,此时的

1.精确率:2/5=40%

2.召回率:2/2=100%

虽然预测错了3次,但是我们把会造成灾难的2次地震全预测到了。

应该如何取舍呢?

假设地震发生没有预测到会造成百亿级别的损失,而地震没发生误报了地震会造成百万级别的损失

显然,这种情况下我们应该接受为了不能漏掉一次地震而多次误报带来的损失,即提升召回率

精确率和召回率有什么用?为什么需要它?通俗讲解(人话)

上面我们已经讲的很清楚了,这里以两种需求为例

  • 预测地震 - 不能接受漏报
  • 人脸识别支付(银行人脸支付) - 不能接受误检

人脸识别支付:主要提升精确率,更倾向于不能出现错误的预测。

应用场景:你刷脸支付时就算几次没检测到你的脸,最多会让你愤怒,对银行损失不大,但是如果把你的脸检测成别人的脸,就会出现金融风险,让别人替你买单,对银行损失很大。所以宁愿让你付不了钱,也不会让别人帮你付钱。

预测地震:主要提升召回率,更倾向于宁愿多预测一些错的也不能漏检。

应用场景:地震预测时宁愿多预测一些错的,也不想漏掉一次地震,预测错误最多会让大家多跑几趟,造成少量损失。只要预测对一次,就会挽回百亿级别的损失,之前所有的损失都值了。

不同的应用场景,需要的评价标准不一样,所以才会有这些率。

<think>嗯,用户问的是MAE和F1召回率的区别,我需要先确认这两个指标分别是什么领域的。MAE听起来像是平均绝对误差,属于回归问题的评估指标,而F1值和召回率应该是分类问题中的指标,尤其是二分类。用户可能对这两个指标的应用场景不太清楚,或者混淆了它们的使用情况。 首先,我需要明确两者的定义。MAE,即Mean Absolute Error,是预测值与真实值之间的绝对误差的平均值,用来衡量回归模型的预测准确性。而F1值是精确召回率的调和平均,用于分类模型,尤其是在数据不平衡的情况下综合评估模型的表现。召回率本身是衡量模型找出正类样本的能力,即有多少真实的正例被正确预测了。 接下来,用户可能需要了解它们为什么会被拿来比较,也许是在某个项目中同时涉及到回归和分类问题,或者在模型评估时遇到了困惑。要解释清楚它们的不同之处,需要从应用场景、计算方式、数学含义等方面展开。 需要注意的是,用户可能对这两个指标的基础知识有所了解,但可能没有深入理解它们的区别。因此,在解释时应避免使用过于专业的术语,用通俗易懂的例子来说明。例如,MAE可以用预测房价的例子,而F1和召回率可以用疾病诊断的例子。 另外,要指出它们不能直接比较,因为一个是回归指标,一个是分类指标。用户可能在评估模型时错误地使用了不合适的指标,导致结果不准确。需要强调正确选择评估指标的重要性,根据问题类型选择合适的指标。 最后,确保回答结构清晰,先分别介绍每个指标,再对比它们的区别,最后总结应用场景。这样用户能够逐步理解,并且明确两者的不同用途。</think>MAE(**Mean Absolute Error**,平均绝对误差)和 **F1值/召回率(Recall)** 是机器学习中两种完全不同的评估指标,分别用于不同任务类型(回归 vs. 分类)。以下是它们的核心区别和定义: --- ### **1. MAE(平均绝对误差)** - **任务类型**:**回归任务**(预测连续值,如房价、温度)。 - **定义**:所有样本预测值与真实值的绝对误差的平均值。 **公式**: \[ \text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| \] 其中,\(y_i\) 是真实值,\(\hat{y}_i\) 是预测值。 - **特点**: - 值越小越好(误差越小)。 - 对异常值敏感度较低(因为使用绝对值而非平方)。 **示例**: 预测房价时,若真实价格为 [100万, 200万],预测值为 [105万, 195万],则 MAE = (5 + 5)/2 = 5万。 --- ### **2. F1值(F1-Score)和召回率(Recall)** - **任务类型**:**分类任务**(尤其是二分类,如疾病检测、垃圾邮件识别)。 - **定义**: - **召回率(Recall)**:真实正类中被正确预测的比例,衡量“查全能力”。 \[ \text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}} \] - **F1值**:精确(Precision)和召回率(Recall)的调和平均,平衡两者的矛盾。 \[ \text{F1} = \frac{2 \times \text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} \] - (TP:真正例,FN:假负例,FP:假正例) - **特点**: - 召回率越高,漏检越少;F1值越高,分类器的综合性能越好。 - 适用于类别不平衡场景(如欺诈检测)。 **示例**: 疾病检测中,若真实患者10人,模型检测出8人(漏检2人),召回率 = 8/(8+2) = 80%。 --- ### **关键区别总结** | **指标** | **MAE** | **F1值/召回率** | |----------------|------------------------|------------------------| | 任务类型 | 回归(连续值预测) | 分类(离散标签预测) | | 优化目标 | 最小化预测误差 | 最大化分类准确性 | | 敏感对象 | 数值误差 | 类别分布和混淆矩阵 | | 应用场景 | 房价预测、销量预测等 | 疾病诊断、文本分类等 | --- ### **如何选择?** - 如果目标是预测连续值(如温度),用 **MAE**。 - 如果目标是分类(如判断是否患病),关注 **召回率**(减少漏检)或 **F1值**(平衡精确召回率)。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

千里马不常有

整理不易,点滴助力就是不竭动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值