对于一个二分类问题,我们定义如下指标:
- TP:True Positive,即正确预测出的正样本个数
- FP:False Positive,即错误预测出的正样本个数(本来是负样本,被我们预测成了正样本)
- TN:True Negative,即正确预测出的负样本个数
- FN:False Negative,即错误预测出的负样本个数(本来是正样本,被我们预测成了负样本)
1.分类:
1)正确率(accuracy)
正确率是我们最常见的评价指标,accuracy = (TP+TN)/(P+N),这个很容易理解,就是被分对的样本数除以所有的样本数,通常来说,正确率越高,分类器越好;
2)错误率(error rate)
错误率则与正确率相反,描述被分类器错分的比例,error rate = (FP+FN)/(P+N),对某一个实例来说,分对与分错是互斥事件,所以accuracy =1 - error rate;
3)灵敏度(sensitive)
sensitive = TP/P,表示的是所有正例中被分对的比例,衡量了分类器对正例的识别能力;
4)特效度(specificity)
specificity =