分类器常用评价指标

最新推荐文章于 2024-09-07 15:25:23 发布

Lance_icg

最新推荐文章于 2024-09-07 15:25:23 发布

阅读量3.3k

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/Lance_icg/article/details/82945884

基本概念

	预测为正样本	预测为负样本
标记为正样本	TP (true positive)	FN (false negative)
标记为负样本	FP (false positive)	TN (true negative)

计算公式：

Accuracy：A=(TP+TN)/(TP+FN+FP+TN)

Precision：P=TP/(TP+FP)

Recall：R=TP/(TP+FN)

F1-score：2/(1/P+1/R) = 2PR/(P+R)

1、accuracy

accuracy也就是我们中文说到的：准确率，定义为：预测结果正确的样本个数占样本总数的概率。accuracy是最常见也是最基本的评价指标。但在数据不平衡的情况下，评价效果很差。举个例子：

100个样本中，99个为负例，1个为正例，分类器只需要把所有的样本标记为负例，准确率就高达99%，可是该模型却是非常差劲的，因为其基本不具有分类效果，在下面的标准中我们会对该评价进行纠正

2、precision

precision就是我们中文说到的：精确率，在信息检索领域也被称为查准率，定义为：在预测为正的样本中，有多少是真正的正样本。在上面的例子中，精确率为0。

3、recall

recall就是我们中文说到的：召回率，在信息检索领域也被称为查全率，定义为：在标记为正的样本中，有多少被预测为正。在上面的例子中，召回率为0。

4、F1-Score

F1值是对准确率和召回率的综合考虑，因为只有在特定的情况下，我们才会只考虑一个指标。比如在检索系统中，用户可能想得到更多的结果，对匹配程度有较大的容忍度，那么该模型的准确率就会比较小，但是召回率就非常大；而在罪犯评判系统中，我们可能希望，对真正有罪的人判刑，因此就要求该模型准确率非常大，召回率可以容忍。除了这些情况下，我们可能就希望准确率和召回率都比较令人满意，F1值就可以对这两个指标进行综合，进而帮助我们进行模型的选择。