基于混淆矩阵的评价指标

混淆矩阵是评估分类算法性能的重要工具,包括TP、FN、FP和TN。准确率和误分率是基本评价指标,Recall和Precision关注正样本的识别,ROC曲线通过AUC值评估模型优劣,FAR和FRR则用于衡量误报和拒真率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >



识别任务中混淆矩阵(Confusion Matrix用于评价算法好坏的指标。下图是一个二分类问题的混淆矩阵:

TP正确肯定——实际是正例,识别为正例

FN错误否定(漏报)——实际是正例,却识别成了负例

FP错误肯定(误报)——实际是负例,却识别成了正例

### 计算混淆矩阵评价指标 对于二分类问题,构建混淆矩阵并计算其评价指标是一个重要的过程。通过统计真正例(True Positive, TP),假负例(False Negative, FN),假正例(False Positive, FP) 和真负例(True Negative, TN) 的数量来完成这一工作。 #### 准确 (Accuracy) 准确是指所有预测正确的样本占总样本的比例。公式表示为: \[ \text{Accuracy} = \frac{\text{TP} + \text{TN}}{\text{TP} + \text{FP} + \text{FN} + \text{TN}} \] 例如,在垃圾邮件分类的例子中,如果共有100封邮件,其中80封是非垃圾邮件(TN=75, FP=5), 20封是垃圾邮件(TP=15, FN=5),那么准确为: \[ \text{Accuracy} = \frac{15 + 75}{15 + 5 + 5 + 75} = 90\% \][^1] #### 召回 (Recall 或 Sensitivity) 召回衡量的是实际为正类别的样本中有多少比例被正确识别出来。公式定义如下: \[ \text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}} \] 继续上面的例子,对于这20封垃圾邮件而言,有15封被成功检测到,则召回为: \[ \text{Recall} = \frac{15}{15 + 5} = 75\% \][^1] #### 精确度 (Precision) 精确度反映了在所有预测为正类别的情况下有多少是真的正类别成员。具体表达方式为: \[ \text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}} \] 同样基于之前的案例数据,即在这总共20个标记为垃圾邮件的结果里实际上只有15个确实如此,因此精度为: \[ \text{Precision} = \frac{15}{15 + 5} = 75\% \][^3] #### F1分数 (F1 Score) F1分数是精确度和召回之间的调和均值,用来平衡两者的重要性。它由下述方程给出: \[ \text{F1-Score} = 2 * (\frac{\text{Precision} * \text{Recall}}{\text{Precision} + \text{Recall}}) \] 利用上述得到的数据,可以得出该模型关于垃圾邮件分类的F1得分为: \[ \text{F1-Score} = 2 * (\frac{75\% * 75\%}{75\% + 75\%}) ≈ 75\%\][^2] ```python def calculate_metrics(tp, tn, fp, fn): accuracy = (tp + tn) / (tp + fp + fn + tn) recall = tp / (tp + fn) precision = tp / (tp + fp) f1_score = 2 * ((precision * recall) / (precision + recall)) return { 'accuracy': round(accuracy*100, 2), 'recall': round(recall*100, 2), 'precision': round(precision*100, 2), 'f1_score': round(f1_score*100, 2) } metrics = calculate_metrics(15, 75, 5, 5) print(metrics) ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值