理解TP、FP、TN、FN

文章介绍了二元分类中的正类和负类概念,正类通常为少数,负类为多数。讨论了预测标记与真实标记的四种组合,包括真阳性、真阴性、伪阳性、伪阴性。接着阐述了查准率(Precision)和准确率(Accuracy)这两个评估分类器性能的指标,强调了在某些情况下准确率可能不是最佳选择。

概念定义

按照常用的术语,将两个类分别称为正类 (positive) 和 负类 (negative)。使用数学表示: +1表示正类 , -1 表示负类。

正类通常是少数类,即样本较少的类(例如有缺陷的零件)

负类通常是多数类,即具有更多样本的类(例如合格的零件)

单个类别内的比率

对于一个样本 x ,真实标记 y 和预测标记 f(x) 之间有四种可能的组合,如下表所示:

预测标记 f(x) = +1预测标记 f(x) = -1
真实标记y=+1真阳性(true positive)真阴性(true negative)
真实标记y=-1伪阳性(false positive)伪阴性(false negative)

在每种可能的情况里,第二个字指的是预测的标记。第一个字用来描述预测是否正确。

例如,伪阳性表示预测的标记是“阳性” (+1),这个预测是错误的(“伪”);因此,真正的标记是“阴性”(-1)

TP:True Positive,分类器预测结果为正样本,实际也为正样本,即正样本被正确识别的数量。

FP:False Positive,分类器预测结果为正样本,实际为负样本,即误报的负样本数量。

TN:True Negative,分类器预测结果为负样本,实际为负样本,即负样本被正确识别的数量。

FN:False Negative,分类器预测结果为负样本,实际为正样本,即漏报的正样本数量。

Accuracy:准确率

Accuracy表征的是预测正确的样本比例。不过通常不用这个概念,主要是因为预测正确的负样本这个没有太大意义。

样本总数: TOTAL = TP+FN+FP+TN

Accuracy = (TP+TN) / 样本总数

Precision:查准率

Precision表征的是预测正确的正样本的准确度,查准率等于预测正确的正样本数量/所有预测为正样本数量。Precision越大说明误检的越少,Precision越小说明误检的越多。

Precision= TP / (TP+FP)

参考:https://zhuanlan.zhihu.com/p/386064764

https://zhuanlan.zhihu.com/p/498846393

### True Positive (TP), False Positive (FP), True Negative (TN), 和 False Negative (FN) 的定义 #### 1. **True Positive (TP)** True Positive 表示模型正确预测为正类的实际正类样本数量。换句话说,当实际标签为正类时,模型也成功将其分类为正类的情况称为 True Positive[^1]。 #### 2. **False Positive (FP)** False Positive 是指模型错误地将负类样本预测为正类的数量。这种情况通常被称为“误报”,即实际上属于负类的样本被错误地标记为了正类[^3]。 #### 3. **True Negative (TN)** True Negative 表示模型正确预测为负类的实际负类样本数量。这意味着对于那些真正不属于目标类别(负类)的样本,模型能够准确识别它们[^4]。 #### 4. **False Negative (FN)** False Negative 是指模型未能检测到实际为正类的样本,而错误地将其标记为负类的情况。这种现象可以理解为“漏检”。 --- ### TPFPTNFN之间的关系及其应用 这些指标常用于评估二分类模型的表现,并通过计算各种性能度量来衡量模型的有效性: - **召回率(Recall 或 Sensitivity)**: Recall 描述了模型在所有真实正类中找到的比例,其公式为: \[ \text{Recall} = \frac{\text{True Positives}}{\text{True Positives} + \text{False Negatives}} \] - **精确率(Precision)**: Precision 衡量的是模型预测为正类的样本中有多少确实是真正的正类,其公式如下: \[ \text{Precision} = \frac{\text{True Positives}}{\text{True Positives} + \text{False Positives}} \] - **特异性(Specificity)**: Specificity 计算的是模型正确拒绝负类的能力,具体表达式为: \[ \text{Specificity} = \frac{\text{True Negatives}}{\text{True Negatives} + \text{False Positives}} \] - **准确率(Accuracy)**: Accuracy 给出了整体预测正确的比例,适用于数据分布较为平衡的情况下: \[ \text{Accuracy} = \frac{\text{True Positives} + \text{True Negatives}}{\text{Total Predictions}} \][^1] --- ### 示例代码展示 以下是 Python 中实现上述公式的简单代码片段: ```python def calculate_metrics(tp, fp, tn, fn): recall = tp / (tp + fn) if (tp + fn) != 0 else 0 precision = tp / (tp + fp) if (tp + fp) != 0 else 0 specificity = tn / (tn + fp) if (tn + fp) != 0 else 0 accuracy = (tp + tn) / (tp + tn + fp + fn) return { 'Recall': recall, 'Precision': precision, 'Specificity': specificity, 'Accuracy': accuracy } # 假设输入值 metrics = calculate_metrics(90, 10, 85, 15) print(metrics) ``` 此函数接收四个参数 `tp`, `fp`, `tn`, `fn` 并返回相应的评价指标。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值