在很多实际应用中,我们知道仅仅关心正确分类的结果是不够的,并且,在数据偏斜比较严重的情况下,模型准确率可能具有相当程度的误导性,我们也需要知道数据被错误分类的情况,以确认为此需要承担的分类错误的代价。(False Positive假阳性和False Negative假阴性,这两种情况)
查准率(Precision精度):用于描述所有被正确分类的样本中真阳性的比值。
查全率(Recall召回率):真阳性样本的数量与样本集中所包含的全部阳性样本的比值。
分类结果混淆矩阵
真实情况 |
在很多实际应用中,我们知道仅仅关心正确分类的结果是不够的,并且,在数据偏斜比较严重的情况下,模型准确率可能具有相当程度的误导性,我们也需要知道数据被错误分类的情况,以确认为此需要承担的分类错误的代价。(False Positive假阳性和False Negative假阴性,这两种情况)
查准率(Precision精度):用于描述所有被正确分类的样本中真阳性的比值。
查全率(Recall召回率):真阳性样本的数量与样本集中所包含的全部阳性样本的比值。
分类结果混淆矩阵
真实情况 |