一、混淆矩阵
| 预测为真 | 预测为假 | |
|---|---|---|
| 真实为真 | TP (True Positive) | FN (False Negative) |
| 真实为假 | FP (False Positive) | TN (True Negative) |
案例:
真实值:0 1 1 0 1 1 0 0 1 0 1 0 1 0 0
预测值:1 1 1 1 1 0 0 0 0 0 1 1 1 0 1

二、重要指标
(1)精确率(precision、positive predictive value、ppv):
TP / (TP + FP)
即鉴定为阳性的所有数据中,确实为阳性的数据所占比。衡量算法的精确度。
(2)召回率(recall、sensitivity(敏感度)、True Positive Rate(真阳性率/TPR)):
TP / (TP + FN)
即所有确实为阳性的数据中被鉴定出来的比率。
(3)特异度(specificity、True Negative Rate(真阴性率/TNR)):
TN / (TN + FP)
即所有确实为阴性的数据中被鉴定出来的比率。
(4)假阳性率(False Positive Rate(FPR)):
FP / (FP + TN)
即所有确实为阴性的数据中被鉴定成阳性的比率。
(5)F1值:精确率和召回率的调和平均数。F1值越接近1,模型输出越好。
2 1 p r e c i s i o n + 1 r e c a l l \Large \frac 2 {\frac 1 {precision} + \frac 1 {recall}} <

本文详细介绍了混淆矩阵的概念,包括真阳性(TP)、假阳性(FP)、真阴性(TN)和假阴性(FN)的定义,并通过实例进行解释。接着,阐述了精确率、召回率、特异度、假阳性率和F1值等重要评估指标的计算方法及其在算法评价中的作用。最后,讲解了ROC曲线的生成原理,以及如何使用sklearn库绘制ROC曲线,强调了AUC值作为模型性能评估的重要性。
最低0.47元/天 解锁文章
3854

被折叠的 条评论
为什么被折叠?



