机器学习分类器评估与回归基础
1. 分类器性能评估基础指标
1.1 分类器可能的输出结果
在评估分类器性能时,我们首先需要了解将分类器应用于已知真实类别的实体时可能出现的结果:
- 真正例(True Positive):分类器正确识别出的正例。
- 真反例(True Negative):分类器正确识别出的反例。
- 假反例(False Negative):分类器将正例错误地标记为反例。
- 假正例(False Positive):分类器将反例错误地标记为正例。
1.2 混淆矩阵
这些结果可以用混淆矩阵以表格形式展示,帮助我们直观地了解分类器正确预测和错误分类的频率。混淆矩阵的结构如下表所示:
| 预测类别 \ 真实类别 | 正类 | 反类 |
| ---- | ---- | ---- |
| 正类 | $N_{TP}$ | $N_{FN}$ |
| 反类 | $N_{FP}$ | $N_{TN}$ |
其中,$N_{TP}$ 是真正例的数量,$N_{TN}$ 是真反例的数量,$N_{FP}$ 是假正例的数量,$N_{FN}$ 是假反例的数量。分类器的所有预测结果都可以归入这四个类别,因此输入分类器的实例集大小等于 $N_{TP} + N_{TN} + N_{FP} + N_{FN}$。
1.3 分类准确率和错误率
- 分类准确率(Accuracy) :分类器在所有预测中做出正确预测的比例,计算公式为:
$Accuracy = \frac{N_{TP} +
超级会员免费看
订阅专栏 解锁全文
1228

被折叠的 条评论
为什么被折叠?



