机器学习评价指标

混淆矩阵

在这里插入图片描述

True Positive (真正, TP)被模型预测为正的正样本;

True Negative(真负 , TN)被模型预测为负的负样本 ;

False Positive (假正, FP)被模型预测为正的负样本;

False Negative(假负 , FN)被模型预测为负的正样本;

准确率

准确率(Accuracy)。顾名思义,就是所有的预测正确(正类负类)的占总的比重

a c c u r a c y = T P + T N T P + F N + F P + T N \rm accuracy = \frac{TP + TN}{TP + FN + FP + TN} accuracy=TP+FN+FP+TNTP+TN​​

真正率

True Positive Rate(真正率 , TPR)或灵敏度(sensitivity),也叫召回率

T P R = T P T P + F N \rm TPR = \frac{TP}{TP + FN} TPR=TP+FNTP

正样本预测结果数 / 正样本实际数

假正率

False Positive Rate (假正率, FPR)

F P R = F P F P + T N \rm FPR = \frac{FP}{FP + TN} FPR=FP+TNFP

被预测为正的负样本结果数 /负样本实际数

精确率

精确率(Precision),查准率。即正确预测为正的占全部预测为正的比例。个人理解:真正正确的占所有预测为正的比例。

p r e c i s i o n = T P T P + F P \rm precision = \frac{TP}{TP + FP} precision=TP+FPTP

召回率

召回率(Recall),查全率,也叫真正率TPR。即正确预测为正的占全部实际为正的比例。个人理解:真正正确的占所有实际为正的比例。

r e c a l l = T P T P + F N \rm recall = \frac{TP}{TP + FN} recall=TP+FNTP

F-measure(F1)值

精确率越高越好,召回率越高越好。F1分数同时考虑精确率和召回率,让两者同时达到最高,取得平衡,F1越大越好!

F 1 = 2 × p r e c i s i o n × r e c a l l p r e c i s i o n + r e c a l l \rm F1 = \frac{2 \times precision \times recall }{precision + recall} F1=precision+recall2×precision×recall​​(标准公式)------(2)

F 1 = 2 1 p r e c i s i o n + 1 r e c a l l \rm F1 = \frac{2}{\frac{1}{precision} + \frac{1}{recall}} F1=precision1+recall12​​(方便理解)------(1)

从(1)看出,Recall不变时,Precision越大,1/Precision越小,从而F1越大。

同理: Precision不变时,Recall越大,1/Recall越小,从而F1越大。

上面式子(2)可以由式子(1)推导出来。

代码点亮人生,思维改变世界~

机器学习中的评价指标(也称为评估指标或性能度量)是用来衡量模型预测结果与实际标签之间的准确性和一致性。它们帮助我们了解模型在特定任务上的性能好坏。常见的机器学习评价指标有: 1. **精确 (Precision)**:指预测为正类中真正为正的比例,即 TP / (TP + FP),适用于关注减少误报的情况,如垃圾邮件过滤。 2. **召回率 (Recall or Sensitivity)**:又称查准,表示实际为正类中被正确识别的比例,即 TP / (TP + FN),适用于关注发现所有正例的重要性,如癌症检测。 3. **F1分数 (F1 Score)**:综合了精确召回率,是两者加权平均的结果,计算公式为 2 * (Precision * Recall) / (Precision + Recall)。它对于类别不平衡的数据集特别有用。 4. **AUC-ROC (Area Under the Receiver Operating Characteristic Curve)**:主要用于二分类问题,衡量的是模型区分正负样本的能力,曲线下面积越大,说明模型性能越好。 5. **均方误差 (Mean Squared Error, MSE)**:用于回归问题,计算预测值与真实值之间差的平方的平均数,数值越小表示模型拟合得越好。 6. **交叉验证得分 (Cross-validation Score)**:通过将数据分为训练集和验证集多次,计算得到的一组平均分数,防止过拟合和偶然性影响。 7. **Log Loss**:用于衡量概预测的准确性,常用于评估二分类问题的模型性能。 选择哪种评价指标取决于具体的任务需求,比如平衡错误类型、对异常值的容忍度以及业务目标等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MathDance

代码点亮人生,代码改变世界……

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值