预测 | |||
---|---|---|---|
0 | 1 | ||
真实 | 0 | TN | FP |
1 | FN | TP |
TP(True Positive)、FP(False Positive)、TN(True Negative)和FN(False Negative)是用于评估分类模型性能的四个基本概念,特别是在二分类问题中。这些概念帮助我们理解模型在预测正类和负类时的准确性。
-
True Positive (TP): 当一个样本实际上是正类(例如,病人确实有病),并且模型正确地预测了它是正类时,这种情况称为真阳性。它表示模型成功地识别出了一个正例。
-
False Positive (FP): 如果一个样本实际上是负类(例如,病人实际上没有病),但模型错误地预测为正类,这就是假阳性。这可能导致不必要的警报或治疗,比如误诊。
-
True Negative (TN): 当一个样本实际上是负类,并且模型正确地预测了它是负类时,这是真阴性。这意味着模型正确地排除了某个情况,比如正确判断某人未患病。
-
False Negative (FN): 如果一个样本实际上是正类,但模型错误地预测为负类,这就是假阴性。这在某些情况下可能非常严重,比如未能识别出疾病患者。
这些指标可以用来计算各种评价指标,如准确率、精确率、召回率和F1分数等,以全面评估模型的性能。例如:
- 准确率 = (TP + TN) / (TP + FP + TN + FN),衡量所有预测中正确的比例。
- 精确率 = TP / (TP + FP),关注在所有被预测为正类的样本中,实际为正类的比例。
- 召回率 = TP / (TP + FN),衡量所有实际正类中被正确预测为正类的比例,也称为敏感度。
- FPR (False Positive Rate) = FP / (FP + TN),常用于ROC曲线中,表示预测为正类的负类样本的比例。