接下来以垃圾信息分类器作为例子说明:
一、垃圾短信分类器
对于垃圾短信分类器,当分类器将一条短信正确地预测为垃圾短信时为真阳性;当分类器将一条短信正确地预测为非垃圾短信时为真阴性;当非垃圾信息被预测为垃圾信息时为假阳性;当垃圾信息被预测为非垃圾信息时为假阴性;
| 垃圾信息 | 非垃圾信息 | |
|---|---|---|
| 预测为垃圾信息 | 真阳性(TP) | 假阳性(FP) |
| 预测为非垃圾信息 | 假阴性(FN) | 真阴性(TN) |
二、二元分类性能指标
1. 准确率
准确率用来衡量分类器预测正确的比例。但它不能区分假阳性错误和假阴性错误。
2. 精准率和召回率
精准率表示阳性预测结果为正确的比例,在垃圾短信分类器中,精准率表示被分类为垃圾短信的信息实际上为垃圾短信的比例。
真阳性+真阴性 真阳性+真阴性+假阳性+假阴性 \frac{\text{真阳性+真阴性}}{\text{真阳性+真阴性+假阳性+假阴性}}

本文通过垃圾短信分类器的例子,介绍了二元分类的性能指标:准确率、精准率、召回率、F1值和ROC AUC。准确率衡量预测正确比例,精准率表示阳性预测正确比例,召回率表示真实阳性实例被识别的比例,F1值是精准率和召回率的调和平均数,ROC AUC则展示了分类器对所有阈值的性能,且对类别不平衡不敏感。
最低0.47元/天 解锁文章
1909

被折叠的 条评论
为什么被折叠?



