- ROC曲线
接收器操作特性曲线(receiver operating characteristic curve),曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。
- 概念定义:
真正(TruePositive , TP)被模型预测为正的正样本;
假负(FalseNegative , FN)被模型预测为负的正样本;
假正(FalsePositive , FP)被模型预测为正的负样本;
真负(TrueNegative , TN)被模型预测为负的负样本。
真正率(True Positive Rate ,TPR)或灵敏度(sensitivity):
TPR = TP /(TP + FN) (正样本预测结果数 / 正样本实际数)
假负率(False Negative Rate , FNR):
FNR = FN /(TP + FN) (被预测为负的正样本结果数 / 正样本实际数 )
假正率(False Positive Rate ,FPR):
FPR = FP /(FP + TN) (被预测为正的负样本结果数 /负样本实际数)
真负率(True Negative Rate , TNR)或特指度(specificity):
TNR = TN /(TN + FP) (负样本预测结果数 / 负样本实际数)
目标属性的被选中的那个期望值称作是“正”(positive)
横轴:假正率(FPR)特异度 Specificity
代表分类器预测的正中实际负例占所有比。 1-Specificity
纵轴:真正率(TPR

ROC曲线是评估分类模型性能的重要工具,它通过真正率(TPR)和假正率(FPR)展示了模型在不同阈值下的表现。AUC作为ROC曲线下的面积,值越大表明模型分类能力越强。本文介绍了ROC曲线的概念、计算方法以及AUC的含义,强调了AUC在处理不平衡数据集时的优势,并讨论了过拟合、交叉验证等模型评估与优化方法。
最低0.47元/天 解锁文章
1328

被折叠的 条评论
为什么被折叠?



