不平衡分类问题中的精度、召回率和 F 值度量
1. 分类准确率的局限性
分类准确率是指正确预测的数量除以总预测数量,它计算简单且易于理解,因此是评估分类模型最常用的指标。然而,当类别分布严重偏斜时,这种直观的评估方式就会失效。
1.1 分类准确率的定义
分类准确率的计算公式为:
[Accuracy = \frac{Correct Predictions}{Total Predictions}]
错误率则是:
[Error Rate = \frac{Incorrect Predictions}{Total Predictions}]
并且准确率和错误率是互补的,即:
[Accuracy = 1 - Error Rate]
[Error Rate = 1 - Accuracy]
我们还可以从混淆矩阵的角度来理解准确率。对于二分类问题,混淆矩阵如下:
| | 正预测 | 负预测 |
| — | — | — |
| 正类 | 真正例 (TP) | 假负例 (FN) |
| 负类 | 假正例 (FP) | 真负例 (TN) |
此时准确率和错误率的计算公式分别为:
[Accuracy = \frac{TP + TN}{TP + FN + FP + TN}]
[Error Rate = \frac{FP + FN}{TP + FN + FP + TN}]
1.2 不平衡分类中准确率的失效
在不平衡分类问题中,训练数据集中各类别的示例分布不均。当类别分布只是轻微偏斜时,准确率仍可能是一个有
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



