分类器性能评价标准有很多,其中比较常用的主要有准确度、错误率、查全率、查准率、F1等。
分类器对测试样本进行分类时,一部分样本被正确分类,一部分样本被错误分类。可以用混淆矩阵对这两种分类结果可视化:
预测类型 | |||
+ | - | ||
实际类型 | + | 正确的正例(TP) | 错误的负例(FN) |
- | 错误的正例(FP) | 正确的负列(TN) |
对角线上是被正确分类的样本,分别是被正确分类的正例(TP个)、被正确分类的负例(TN个)。
次对角线上是被错误分类的样本,分别是被错误分类正例(FP个)、被错误分类的负例(FN个)。
那么:
被正确分类的样本量P = TP + TN
被错误分类的样本量N = FP +