怎么理解TP,FP,FN，Precision,Recall

原创于 2025-06-14 14:44:42 发布 · 1.3k 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#经验分享 #笔记

VLA 专栏收录该内容

8 篇文章

订阅专栏

在机器学习和计算机视觉（尤其是目标检测任务）中，TP、FP、FN、Precision（精确率）、Recall（召回率） 是核心的评估指标。它们共同衡量模型的检测性能。以下是通俗易懂的解析：

一、基础概念：检测结果的四种状态

假设任务是从图像中检测车辆：

缩写	全称	定义	简单解释
TP	True Positive (真正例)	模型正确检测到真实目标	图中有车，模型也说“有车” ✅
FP	False Positive (假正例)	模型误将背景识别为目标	图中无车，模型却说“有车” ❌（误报）
FN	False Negative (假负例)	模型漏检了真实目标	图中有车，模型说“无车” ❌（漏检）
TN	True Negative (真负例)	模型正确识别无目标区域	图中无车，模型说“无车” ✅ （目标检测中通常不计算）

💡 关键点：

TP + FP = 模型所有检测到的结果（含错误检测）
TP + FN = 图中所有真实存在的目标（含漏检）

二、核心指标公式与意义

1. 精确率 Precision

衡量模型检测结果的可靠性：

所有被模型检测为目标的物体中，有多少是真正的目标？

$Precision=TPTP+FP\text{Precision} = \frac{TP}{TP + FP}$

越高越好：Precision 高 → 模型误报少（FP 低）。
应用场景：对误检容忍度低的领域（如自动驾驶误将影子当行人可能导致急刹）。

2. 召回率 Recall

衡量模型检测的覆盖率：

图中所有真实目标中，有多少被模型成功检测到？

$Recall=TPTP+FN\text{Recall} = \frac{TP}{TP + FN}$

越高越好：Recall 高 → 模型漏检少（FN 低）。
应用场景：对漏检容忍度低的领域（如医疗影像肿瘤检测）。

三、直观理解：警察抓小偷的比喻

任务：警察（模型）从人群（图像）中抓小偷（目标车辆）。
TP：警察正确抓住小偷 ✅
FP：警察误抓了普通人（冤枉好人）❌
FN：警察没抓到小偷（让他跑了）❌
Precision：警察抓的人中，真实小偷的比例 → 宁可放过，不可错抓？
Recall：所有真实小偷中，被警察抓住的比例 → 宁可错抓，不可放过？

四、Precision 与 Recall 的权衡

Precision 高 + Recall 低：模型保守，只检测确信的目标（漏检多）。

✅ 适合：垃圾邮件过滤（宁可漏掉垃圾邮件，不能误判正常邮件）。
Precision 低 + Recall 高：模型激进，检测出更多目标（误报多）。

✅ 适合：癌症筛查（宁可误判健康人，不能漏掉癌症患者）。
理想状态：Precision 和 Recall 同时提高 → 需模型能力强或优化阈值。

五、实际计算示例（目标检测）

假设一张图中有 10 辆真车（GT），模型输出 15 个检测框：

检测结果	真实情况	分类	计数
框 A	匹配到真车 1	TP	1
框 B	匹配到真车 2	TP	2
框 C	未匹配任何真车（虚警）	FP	1
…	…	…	…
总计
TP = 8	（正确检测到 8 辆车）
FP = 7	（7 个误检框）
FN = 2	（2 辆车未被检测到）

$\text{Precision} = \frac{TP}{TP + FP} = \frac{8}{8 + 7} = 53.3\% \\ \text{Recall} = \frac{TP}{TP + FN} = \frac{8}{8 + 2} = 80.0\%$

📊 结论：模型覆盖率高（Recall=80%），但可靠性低（Precision=53.3%）。

六、扩展：F1 Score —— Precision与Recall的调和平均

当需要综合评估时，使用 F1 Score：
$F1=2×Precision×RecallPrecision+Recall\text{F1} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$

平衡 Precision 和 Recall：F1 越高，模型综合性能越好。
上例中的 F1 = (2 \times \frac{0.533 \times 0.8}{0.533 + 0.8}) = 63.8%。

总结：一张表理解核心概念

指标	关注点	优化方向	应用倾向
Precision	检测结果的可靠性	减少误检（FP ↓）	避免误判的系统
Recall	目标的覆盖率	减少漏检（FN ↓）	避免遗漏目标的系统
F1 Score	综合性能	平衡 Precision 和 Recall	需要兼顾两者的场景