一、ROC曲线
(1)定义
ROC: 接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。常用于二分类问题中的模型比较,主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。
横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity),FPR越大,预测正类中实际负类越多
纵轴:真正类率(true postive rate TPR)灵敏度,Sensitivity(正类覆盖率),TPR越大,预测正类中实际正类越多。
(2)分析
针对一个二分类问题,将实例分成正类(postive)或者负类(negative)。但是实际中分类时,会出现四种情况.
1、若一个实例是正类并且被预测为正类,即为真正类(True Postive TP)
2、若一个实例是正类,但是被预测成为负类,即为假负类(False Negative FN)
3、若一个实例是负类,但是被预测成为正类,即为假正类(False Postive FP)
4、若一个实例是负类,但是被预测成为负类,即为真负类(True Negative TN)
由上表可计算得到:
1、真正类率(True Postive Rate)TPR: TP/(TP+FN),代表分类器预测的正类中实际正实例占所有正实例的比例,即为灵敏度(Sensitivity)、召回率(Recall)
2、准确率(Precision):TP/(TP+FP),代表分类器中预测的所有正类中实际为正类的比例
3、真负类率(True Negative Rate):TN/(FP+TN),代表分类器预测的负类中实际负实例占所有负实例的比例,TNR=1-FPR。Spec