在使用回归器的时候,我们通常用预测结果的准确率来评估模型的优良与否,但该指标并不一定适用于分类器,特别是处理某些偏斜数据集(即某些类比其他类更为频繁时)时。
评估分类器性能的更好方法是混淆矩阵。总体思路就是统计A类别实例被分成为B类别的次数。例如,对于一个0-9数字分类器,要想知道分类器将数字3和数字5混淆多少次,只需要通过混淆矩阵的第5行第3列来查看。
下图是一个二分类器预测结果的混淆矩阵,该分类器的功能是把数字(0-9)分为5(正)和非5(负)两类。
从上图可知,混淆矩阵由四部分组成:第一行第一列是实例为负,预测为负的真负类;第一行第二列是实例为负,预测为正的假正类(FP);第二行第一列是实例为正,预测为负的假负类(FN);第二行第二列是实例为正,预测为正的真正类(TP)。
下面介绍精度、召回率的概念:
精度: 即可以理解为在预测为正的结果中的正确率。
召回率: