分类模型评价指标和方法

最新推荐文章于 2025-03-20 20:34:09 发布

咖啡红蘑菇

最新推荐文章于 2025-03-20 20:34:09 发布

阅读量1.5k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：自然语言处理文章标签：准确率查全率召回率 ROC AUC

本文链接：https://blog.youkuaiyun.com/weixin_38075257/article/details/84676548

自然语言处理专栏收录该内容

3 篇文章

订阅专栏

分类模型评价指标和方法

基本概念

True negative(TN)，称为真反例，实际是负样本预测成负样本的样本数
False positive(FP)，称为假正例，实际是负样本预测成正样本的样本数
False negative(FN)，称为假反例，实际是正样本预测成负样本的样本数
True positive(TP)，称为真反例，实际是正样本预测成正样本的样本数

T和F表示预测是否正确，P和N表示预测结果是正例还是反例

混淆矩阵

真实情况（斜体）	正例	反例
正例	TP	FN
反例	FP	TN

常见指标

准确率
预测正确的比例 $accuracy=(TP+TN)TP+FP+TN+FN\ accuracy=\frac{(TP+TN)}{TP+FP+TN+FN}$
查准率
模型预测为正类的样本中，真正为正类的样本所占的比例 $precision=TPTP+FP\ precision=\frac{TP}{TP+FP}$
召回率（查全率）
模型正确预测为正类的样本的数量，占总的正类样本数量的比值 $recall=TPTP+FNrecall=\frac{TP}{TP+FN}$
P-R曲线
查准率和查全率是一对矛盾的度量，一般来说，查准率高时，查全率往往偏低，查全率高时，查准率往往偏低。查准率-查全率曲线：precision为纵轴，recall为横轴。P-R曲线见下：

如果一个模型的P-R曲线完全包住另一个学习器的P-R曲线，则前一个模型一定更优。如图中的模型A包住了模型C，故模型A优于模型C；B也包住了C，模型B也优于模型C。模型A和模型B有交叉重叠的部分，我们需要比较曲线下方的面积大小，但曲线下方的面积并不容易直接比较。故引入平衡点或者是F1值进行比较。 - 平衡点平衡点(BEP)是查准率等于查全率时的取值，如果这个值较大，则说明学习器的性能较好。如上图，模型A的平衡点值大于模型B，故模型A优于模型B。

$F_{1}$ -Score
- $F1=2∗P∗RP+RF_{1}= \frac{2 * P * R }{P + R }$ ，同样，F1值越大，我们可以认为该学习器的性能较好。
- $F_1$ 其实是查准率和查全率的调和平均,即认为 $F_1$ 中的"1"表示的意义就是查准率和查全率的重要性相同。
  $1F1=12(1P+1R)\frac{1}{F_1} = \frac{1}{2}(\frac{1}{P}+\frac{1}{R})$
$Fβ−scoreF_{\beta}-score$
- $FβF_{\beta}$ 是查准率和查全率的加权调和平均。当 $0<β<10<\beta<1$ 时,查准率precision影响较大(如用户推荐时,为了尽可能少的打扰用户希望推荐的里面尽可能是用户喜欢的,此时precision较为重要);当 $β>1\beta>1$ 时,查全率recall影响更大(如当检索罪犯信息时,希望所有罪犯均能够被识别出来,此时recall较为重要);当 $β=1\beta=1$ 时,查准率和查全率一样重要即 $F_1$ 。
  $1Fβ=11+β2(1P+β2R)Fβ=(1+β2)P∗R(β2∗P)∗R\frac{1}{F_{\beta}} = \frac{1}{1+\beta^2}(\frac{1}{P}+\frac{\beta^2}{R}) \\ \\ F_{\beta} = \frac{(1+\beta^2)P*R}{(\beta^2*P)*R}$
- 调和平均与算数平均以及几何平均相比,更重视较小的值。

ROC曲线

ROC曲线即受试者工作特征曲线 (receiver operating characteristic curve),又称为感受性曲线(sensitivity curve)。横坐标为假正例率(FPR)，纵坐标为真正例率(TPR)。横坐标 $FPR=FPFP+TNFPR=\frac{FP}{FP+TN}$ ，纵坐标 $TPR=TPTP+FNTPR=\frac{TP}{TP+FN}$ 。由公式可以看到横纵坐标都在[0,1]之间，所以ROC曲线的面积小于等于1。

ROC曲线的性质
- (0,0)：假正例率和真正例率都为0，TP=FP=0，即全部预测成负样本
- (0,1)：假正例率为0，FP=0，真正例率为1，FN=0，全部完美预测正确
- (1,0)：假正例率为1，TN=0，真正例率为0，TP=0，全部完美预测错误
- (1,1)：假正例率和真正例率都为1，FN=TN=0，即全部预测成正样本
- TPR＝FPR，斜对角线，预测为正样本的结果一半是对的，一半是错的，代表随机分类器的预测效果

ROC曲线在斜对角线以下，则表示该分类器效果差于随机分类器，反之，效果好于随机分类器。期望是ROC曲线尽量位于斜对角线以上，也就是向左上角（0,1）凸，因为(0，1)为完美预测。