0 分类问题评价指标
根据分类器在测试数据集上的预测或正确或不正确可以分为四种情况:
TP——将正类预测为正类数
FN——将正类预测为负类数
FP——将负类预测为正类数
TN——将负类预测为负类数
记忆方法:
T=True=+1 F=False=-1 (T和N并不是指代实际的是正类和负类)
P=Positive=+1 N=Negative=-1 (P和N指明了预测的是正类还是负类)
实际正例=+1 实际负例=-1
实际的正类和负类按照下面的方法:
TP的实际类别 = 1*1=1(实际正例)
FN的实际类别=-1*-1=1(实际正例)
FP的实际类别=-1*1=-1(实际负例)
TN的实际类别=1*-1=-1(实际负例)
因此:
TP+FN=实际正例的数量
TP+FP=预测正例的数量
准确率 accuracy=TP+TNP+N=正确分类数量样本总数=所有正例P+所有负例N a c c u r a c y = T P + T N P + N = 正 确 分 类 数 量 样 本 总 数 = 所 有 正 例 P + 所 有 负 例 N