Precision(精准率) and Recall(召回率)

本文介绍了在机器学习中遇到偏斜类别数据集时,精确度作为评估标准的局限性。文章通过图解阐述了精准率和召回率的概念,并指出在处理如奖学金获取或疾病诊断等类别不平衡问题时,应使用精准率和召回率作为评价模型性能的指标。同时,提到了F1值在选择模型和调整λ值中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在机器学习系统设计的时候会遇到一类数据集:Skewed Classes 。这意味着在分类时一种类别比其他的类别多的多。
会出现的情况:构建的模型的精确度(代价) 甚至不如直接将其全部分为数量多的那个类别。比如:分类是否获得学校奖学金,分类是否是癌症患者。
带来的问题:将精确度(或者代价)作为衡量算法是否好的标准变的不再有效。
解决的方法:使用Precision(精准率) and Recall(召回率) 取代精确度(代价)

1. 图解Precision和Recall

这里写图片描述
图中True 或 False 表示预测是否准确,Postive 或 negative 表示预测的两种类别。

Precision=True positivePredicted postive=True positiveTrue positive + 
### 关于精准召回率的概念与计算 #### 精准Precision精准是指在所有被模型预测为正例的样本中,实际为正例的比例。它衡量的是模型对于正例预测的准确性。其计算公式如下: \[ \text{Precision} = \frac{\text{True Positives (TP)}}{\text{True Positives (TP)} + \text{False Positives (FP)}} \] 其中: - True Positives (TP): 被正确预测为正例的实际正例数量。 - False Positives (FP): 被错误预测为正例的实际负例数量。 这一概念强调减少误报的重要性,在某些场景下尤为重要,比如医疗诊断或金融欺诈检测[^2]。 #### 召回率Recall召回率指的是在所有实际为正例的样本中,被模型成功预测为正例的比例。它反映的是模型对正例的覆盖程度。其计算公式如下: \[ \text{Recall} = \frac{\text{True Positives (TP)}}{\text{True Positives (TP)} + \text{False Negatives (FN)}} \] 其中: - False Negatives (FN): 实际为正例却被预测为负例的数量。 高召回率意味着尽可能多地找到所有的正例,这在诸如疾病筛查等应用场景中非常关键[^3]。 #### 精准召回率的区别 精准关注的是预测结果的质量,即预测为正例的结果中有多少是真正的正例;而召回率则侧重于覆盖,表示有多少比例的真实正例被正确识别出来。两者之间通常存在权衡关系——提高其中一个可能会降低另一个[^4]。 为了综合评价这两者的表现,常用的方法之一是通过F1分数来进行平衡。F1分数定义为精准召回率的调和平均数,具体公式为: \[ F1 = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}} \] 此指标能够在一定程度上兼顾两者的优劣表现[^5]。 ```python from sklearn.metrics import f1_score, precision_score, recall_score # 示例数据 y_true = [0, 1, 1, 0, 1, 0, 1, 0] y_pred = [0, 1, 0, 0, 1, 1, 1, 0] precision = precision_score(y_true, y_pred) recall = recall_score(y_true, y_pred) f1 = f1_score(y_true, y_pred) print(f"Precision: {precision}") print(f"Recall: {recall}") print(f"F1 Score: {f1}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值