精准率 - 召回率曲线与AUC:不平衡分类问题中的评估利器
在分类问题的评估指标中,ROC AUC是一个被广泛使用的指标,但它并非没有问题。在严重倾斜且少数类样本极少的不平衡分类问题中,ROC AUC可能会产生误导。这是因为少量的正确或错误预测可能会导致ROC曲线或ROC AUC分数发生较大变化。当存在类别不平衡问题,特别是少数类实例样本量较小时,ROC图用于评估分类器时,其估计结果可能不可靠。因此,精准率 - 召回率曲线及其曲线下面积(AUC)成为了一个常用的替代指标。
1. 精准率与召回率
精准率(Precision)是衡量正确正预测数量的指标,计算公式为:
[
Precision = \frac{TruePositive}{TruePositive + FalsePositive}
]
结果取值范围在0.0(无精准度)到1.0(完全精准)之间。
召回率(Recall)是衡量所有正预测中正确正预测数量的指标,计算公式为:
[
Recall = \frac{TruePositive}{TruePositive + FalseNegative}
]
结果取值范围同样在0.0(无召回率)到1.0(完全召回)之间。
精准率和召回率都聚焦于正类(少数类),而不关注真负类(多数类),这使得它们能够有效评估分类器在少数类上的性能。
2. 精准率 - 召回率曲线(PR曲线)
精准率 - 召回率曲线(PR曲线)是不同概率阈值下精准率(y轴)和召回率(x轴)的曲线图。
- PR曲线:召回率(x)与精准率(y)的绘图。
- 完美技能的模
超级会员免费看
订阅专栏 解锁全文
796

被折叠的 条评论
为什么被折叠?



