二分类问题评价指标

本文详细介绍了二分类问题的评价指标,包括准确率、精准率、召回率和ROC曲线。通过真阳性和真阴性等概念解释了这些指标的计算方式,并探讨了AUC作为评价分类器好坏的依据。ROC曲线展示了不同阈值下分类器的表现,AUC值越大,分类效果越好。文章还强调了在类不平衡问题中,ROC曲线能保持稳定,是评估分类器的重要工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 分类情况:

针对一个二分类问题,将实例分成正类(postive)或者负类(negative)。但是实际中分类时,会出现四种情况.

(1)若一个实例是正类并且被预测为正类,即为真阳性(True Postive TP)

(2)若一个实例是正类,但是被预测成为负类,即为伪阴性(False Negative FN)

(3)若一个实例是负类,但是被预测成为正类,即为伪阳性(False Postive FP)

(4)若一个实例是负类,但是被预测成为负类,即为真阴性(True Negative TN)

TP:正确的肯定数目

FN:漏报,没有找到正确匹配的数目

FP:误报,没有的匹配不正确

TN:正确拒绝的非匹配数目


2. 准确率ACC

ACC = (TP + TN) / (P + N)

即:(真阳性+真阴性) / 总样本数


3. 精准率和召回率

精确率 :P = TP / (TP + FP)

召回率: R = TP / (TP + FN)

F1: 精确率和召回率的调和平均。 即: 2/F1 = 1/P + 1/R

直观上来解释精确率和召回率。

精确率表示我现在有了这么的预测为正的样本,那么这些样本中有多少是真的为正呢?

召回率表示我现在预测为正的这些值中,占了所有的正的为正的样本的多大比例呢?

不同的分类问题,对精确率和召回率的要求也不同。

例如:假币预测,就需要很高的精确率,我需要你给我的预测数据具有很高的准确性。

肿瘤预测就需要很高的召回率。“宁可错杀三千,不可放过一个”。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值