性能度量——Confusion Matrix混淆矩阵

本文详细介绍了在极度偏斜数据集中如何使用混淆矩阵来评估分类算法性能。混淆矩阵包含精准率和召回率,它们分别衡量预测正确性的不同方面。F1分数用于平衡精准率和召回率。此外,还讨论了ROC曲线及其在评估模型性能中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Confusion Matrix

当数据是极度偏斜的数据集(例如某些罕见疾病)的时候,单纯用分类准确率来评判算法的话就很没用(因为即使你说百分百都是健康的人准确率可能也有百分九十九),可以通过建立混淆矩阵进行分析。
在这里插入图片描述

Precision and Recall

在这里有两个名词Precision精准率Recall召回率
精准率就是我们所关注的那一类事物的预测效果(How many selected items are relevant?),可以理解为做了一百次分类为阳性的预测有多少次是成功的,如前面所说的罕见疾病,精准率在这里就是预测疾病的成功率;
而召回率就是当关注事件真正发生的时候预测到它的效果(How many relevant items are selected?),可以理解为对分类为阳性的样本做预测有多少次是成功的,比如对于所有罕见疾病患者诊断出他真的有病的概率(周志华把它翻译成查准率和查全率让我很懵),计算方法如下:
在这里插入图片描述在这里插入图片描述
用这两个作为指标会比之前简单用预测成功数/预测数得到的准确率更加具体。
举例:如果预测所有人都没罕见疾病而实际上有5个人,即预测全部都是Negative,此时准确率99.95%,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值