理解TP、FP、TN、FN

原创已于 2023-02-23 14:41:19 修改 · 1.8k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #人工智能

于 2023-02-23 14:32:32 首次发布

记录总结专栏收录该内容

12 篇文章

订阅专栏

文章介绍了二元分类中的正类和负类概念，正类通常为少数，负类为多数。讨论了预测标记与真实标记的四种组合，包括真阳性、真阴性、伪阳性、伪阴性。接着阐述了查准率（Precision）和准确率（Accuracy）这两个评估分类器性能的指标，强调了在某些情况下准确率可能不是最佳选择。

概念定义

按照常用的术语，将两个类分别称为正类 (positive) 和负类 (negative)。使用数学表示： +1表示正类， -1 表示负类。

正类通常是少数类，即样本较少的类（例如有缺陷的零件）

负类通常是多数类，即具有更多样本的类（例如合格的零件）

单个类别内的比率

对于一个样本 x ，真实标记 y 和预测标记 f(x) 之间有四种可能的组合，如下表所示：

	预测标记 f(x) = +1	预测标记 f(x) = -1
真实标记y=+1	真阳性（true positive）	真阴性（true negative）
真实标记y=-1	伪阳性（false positive）	伪阴性（false negative）

在每种可能的情况里，第二个字指的是预测的标记。第一个字用来描述预测是否正确。

例如，伪阳性表示预测的标记是“阳性” （+1），这个预测是错误的（“伪”）；因此，真正的标记是“阴性”（-1）

TP：True Positive，分类器预测结果为正样本，实际也为正样本，即正样本被正确识别的数量。

FP：False Positive，分类器预测结果为正样本，实际为负样本，即误报的负样本数量。

TN：True Negative，分类器预测结果为负样本，实际为负样本，即负样本被正确识别的数量。

FN：False Negative，分类器预测结果为负样本，实际为正样本，即漏报的正样本数量。