【AI概念】精度（Precision）vs 召回率（Recall）vs F1分数（F1 Score）详解（附详尽Python代码演示）| 定义与原理、数学公式、案例与代码可视化、工程应用建议、典型案例

原创

已于 2025-06-28 00:17:09 修改 · 1.7k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #人工智能 #精度 #召回率 #F1分数 #python #ai

于 2025-06-27 23:59:20 首次发布

大家好，我是爱酱。本篇将会系统讲解机器学习分类模型中最常用的三大评价指标：精度（Precision）、召回率（Recall）和F1分数（F1 Score）。内容包括定义、数学公式、直观解释、优缺点、典型应用场景和三者的权衡关系，适合初学者和进阶者系统理解。

注：本文章含大量数学算式、详细例子说明及大量代码演示，大量干货，建议先收藏再慢慢观看理解。新频道发展不易，你们的每个赞、收藏跟转发都是我继续分享的动力！

一、基础概念与混淆矩阵（Confusion Matrix）

在二分类任务中，模型输出分为四类：

True Positive (TP)：正类被正确预测为正类
False Positive (FP)：负类被错误预测为正类
False Negative (FN)：正类被错误预测为负类
True Negative (TN)：负类被正确预测为负类

混淆矩阵如下：

	实际为正（Positive）	实际为负（Negative）
预测为正（Positive）	TP	FP
预测为负（Negative）	FN	TN

二、精度（Precision）

1. 定义

精度（Precision）衡量的是模型所有“预测为正”的样本中，真正为正的比例。它关

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

人工智能AI酱

关注关注

24
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

准确率，精准率，召回率，真正率，假正率，ROC/AUC

chase

08-24

4万+

准确率，精准率，召回率，真正率，假正率，ROC/AUC

Python从0到100（九十五）：空洞卷积（Dilated Convolution）网络架构与PAMAP2数据集实验分析

最新发布

张小凡

09-15

903

本文通过摘桃子的例子生动解释了机器学习中的精确率、召回率和F1值三个核心指标。机器人摘了5个桃子，其中4个好（TP），1个坏（FP），漏摘2个好（FN）。计算得出：精确率P=80%（摘得准），召回率R≈67%（摘不全），F1≈73%（综合表现）。图解清晰展示了实际样本与预测结果的对应关系。这三个指标分别反映模型的准确性、覆盖率和整体性能，在评估分类模型时需综合考虑。

机器学习（二十二）：精度和召回率

weixin_45733884的博客

07-24

1262

倾斜数据集：一个数据集中的正面和负面例子的比例非常不平衡，比如数据集中，结果为1的占比20%，结果为0的占比80%例子：如果数据集的结果中只有0.5%是1，其余结果是0。有一个模型的预测准确度是99.5%，但是预测了所有数据的结果都是0，这个模型的准确度很高，但是预测不出结果为1，这不能代表这个模型是好模型。因此需要引入其他的误差度量方式来评估模型好坏。

机器学习中，召回率是什么概念？

余璜的技术博客

03-04

6001

在多分类问题中，计算召回率通常需要把每个类别都当作是“正类”，而所有其他类别都是“负类”，然后分别对每个类别计算召回率。最后，你可能会对所有类别的召回率取平均，得到一个总的召回率指标，这在多分类问题中被称为宏平均召回率（Macro-Averaged Recall）。准确率是指在所有被模型识别为正类的样本中，正确识别的比例。例如，计算“2”的召回率就是在所有实际标记为数字“2”的样本中，有多少被模型正确地识别为“2”。对于“猫”这个类别，召回率将是在所有真实为“猫”的图片中，有多少被模型正确识别为“猫”。

评价标准：精确率-召回率-F1

南方硅人的博客

03-22

923

精确率精确率（precision）是针对我们预测结果而言的。表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了，一种就是把正类预测为正类(TP)，另一种就是把负类预测为正类(FP)，也就是：预测正确的样本占所有预测样本的概率 召回率 召回率（recall）是针对我们原来的样本而言的表示的是样本中的正例有多少被预测正确了。那也有两种可能，一种是把原来的正类预测成正类(TP)，另一种就是把原来的正类预测为负类(FN)。其实就是分母不同，一个分母是预测为正的样本数，另一个是原来样

召回率和精度

weixin_30756499的博客

09-01

581

召回率（Recall）和精度（Precise）是广泛用于信息检索和统计学分类领域的两个度量值，用来评价结果的质量。其中召回率是是检索出的相关文档数和文档库中所有的相关文档数的比率，衡量的是检索系统的查全率。精度是检索出的相关文档数与检索出的文档总数的比率，衡量的是检索系统的查准率。从一个大规模数据集合中检索文档时，可把文档分成四组： 1. 系...

评价指标（一）精确率，召回率，F1-score

weixin_44708254的博客

09-19

2221

先来讲一下精确率(Precision)和准确率(Recall)，首先要明确一点，精确率不等于准确率（Accuracy），两者是不同的，后面也会讲到准确率。很多时候，模型不只关心其中某个指标，因此需要平衡精确率和召回率，因此就有了F1-score，F1值是精确率和召回率的调和均值。识别成狗的有75张，正确识别的55张，识别成猫的25张，正确的15张，那么关系表就如下。也就是说识别成狗的样本里，正确的比例，例子里就等于55/(55+20)假如我们正在做猫狗的二分类识别任务，假设狗是正样本，猫是负样本，

【AI概念】生成式AI（GenAI）vs 判别式AI（Discriminative AI）详解（附详尽Python代码演示）|定义、核心原理、数学表达、工程应用建议|GAN、Diffusion、VAE

AI人工智能爱酱～你的AI学习好帮手～

06-29

1404

大家好，我是爱酱。本篇将会系统梳理生成式AI（Generative AI）与判别式AI（Discriminative AI）的核心原理、数学表达、典型模型（如GAN、Diffusion、VAE等）、适用场景、优缺点和工程应用建议，帮助你系统理解两大AI范式的本质区别与联系。注：本文章含大量数学算式、详细例子说明及大量代码演示，大量干货，建议先收藏再慢慢观看理解。本文章颇长超过8000字长、以及大量详细、完整的Python代码、非常耗时制作，因此，你们的每个赞、收藏跟转发都是我继续分享的动力！

Python实现随机森林算法详解与代码实践

模型训练完成后，项目使用测试集进行预测，并通过多种评估指标衡量性能，如准确率（Accuracy）、精确率（Precision）、召回率（Recall）和F1分数（F1-Score），对于多分类问题还可绘制混淆矩阵（Confusion Matrix）...

【Python集成Ollama模型】：代码示例与详解，专家级教程

![【Python集成Ollama模型】：代码示例与详解，...Ollama模型是人工智能领域的一个创新，它融合了多种机器学习技术，为处理复杂的数据分析任务提供了强大的工具。我们将简单介绍Ollama模型的基本概念、设计理念以及它如

详解分类指标Precision，Recall，F1-Score

酒酿小圆子呀～

07-20

8275

在使用机器学习算法的过程中，我们需要对建立的模型进行评估来辨别模型的优劣，下文中主要介绍常见的几种评估指标。以下指标都是对分类问题的评估指标。在二分类任务中，假设只有正类（1）和负类（0）两个类别，True（1）和False（0）分别表示预测结果对或错；Positive（1）和Negative（0）表示预测为正类或负类。这里：True/False代表判断结果是否正确，Positive/Negative代表预测类别结果。

【机器学习】精确率，召回率，F1

UESTC_201722的博客

03-31

452

Precision 精确率(Precision）是指在所有系统判定的“真”的样本中，确实是真的的占比，就是TP/(TP+FP)。 Recall 召回率（Recall）是指在所有确实为真的样本中，被判为的“真”的占比，就是TP/(TP+FN)。 F1-Score ...

精确率、召回率、F1值

cool-wangtongzhou

06-24

2761

T是True，F是False，P是positive，N是negetive TP ——将正类预测为正类的数量（解释为：预测正确，预测成正类，所以说明原来是个正类） FN ——将正类预测为负类的数量（预测错误，预测成负数，所以说明原来是个正类，其实有那种负负得正的感觉） FP ——将负类预测成正类的数量 TN ——将负类预测成负类的数量一、精确率:就是有多少正类是被分对的 P=TP/(TP+FP),TP+FP是预测出来是正类的总数二、召回率：在实际正类中，有多少正类被模型发现了 R = TP/(TP+FN),T

评估指标：精确率（Precision）、召回率（Recall）、F1分数（F1 Score）

FriendshipTang的博客

07-11

4170

人工智能、评估指标、精确率（Precision）、召回率（Recall）、F1分数（F1 Score）

精确率（Precision）、召回率（Recall）和F1值

m0_61972043的博客

10-28

3410

text{F1值} = 2 \times \frac{\text{精确率} \times \text{召回率}}{\text{精确率} + \text{召回率}}\text{精确率} = \frac{\text{真正例（TP）}}{\text{真正例（TP）} + \text{假正例（FP）}}\text{召回率} = \frac{\text{真正例（TP）}}{\text{真正例（TP）} + \text{假负例（FN）}}F1值是精确率和召回率的调和平均数，它综合考虑了精确率和召回率的平衡。

精确率 召回率 F1（详细）

qq_20449731的博客

02-05

1947

python 计算F1score

09-10

在Python中计算F1分数通常用于评估二分类模型的性能，特别是在不平衡的数据集上，F1分数能够综合考虑精确率（Precision）和召回率（Recall）。F1分数是精确率和召回率的调和平均值，公式如下： \[ F1 = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} \] 其中，精确率（Precision）表示预测为正类的样本中有多少是真正的正类，而召回率（Recall）则表示所有实际正类中，有多少被正确识别出来。在Python中，我们可以使用sklearn库中的`f1_score`函数来计算F1分数。以下是一个简单的例子： ```python from sklearn.metrics import f1_score from sklearn.preprocessing import LabelBinarizer # 假设y_true是实际标签列表，y_pred是预测结果列表 y_true = [0, 1, 1, 0, 1] y_pred = [0, 1, 0, 0, 1] # 对类别进行编码，如果数据是非二元的，可以使用LabelBinarizer lb = LabelBinarizer() y_true_encoded = lb.fit_transform(y_true) y_pred_encoded = lb.transform(y_pred) # 计算F1分数 f1 = f1_score(y_true_encoded, y_pred_encoded, average='binary') # 'binary'用于二分类任务 print(f"F1 Score: {f1}") ```