机器学习模型评估指标-混淆矩阵-精度-召回率-F1分数

最新推荐文章于 2024-12-30 14:23:57 发布

置顶

呵呵镜

最新推荐文章于 2024-12-30 14:23:57 发布

阅读量2.2k

点赞数

CC 4.0 BY-SA版权

分类专栏：大数据文章标签：机器学习评估指标 F1得分精度召回率

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/liujing319/article/details/91958774

本文介绍了机器学习模型的评估指标，包括混淆矩阵、精度、召回率和F1分数。混淆矩阵用于描述模型预测结果的四个基本类别：真阳性、真阴性、假阳性、假阴性。精度关注正确预测为阳性的比例，而召回率关注真正阳性的样本被正确预测的比例。F1分数结合精度和召回率，是两者的调和平均数。根据不同业务需求，可以选择不同的F-β得分来平衡精度和召回率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在复盘udacity 的机器学习的课程，现在来整理一下关于机器学习模型的评估指标的相关知识。

不同数据集采用不同的模型进行训练，会得到完全不同的效果，那么如何衡量一个模型是否适合该数据集呢？在数据集训练后可以对一些指标进行运算，观察实际的效果，进行调整参数或者更换模型等等。

学习模型的评估指标常用的有几种：F-β得分（F1得分，F2得分等等，根据不同的业务实际需求来指定适合的β值），ROC 曲线，回归指标包含：平均绝对误差，均方误差，R2分数等等

1 混淆矩阵

上图为检测特定疾病的例子，如果一个人检测出生病，那么成为阳性，如果检测结果是未生病则为阴性，阳性分为真阳性和假阳性，阴性分为真阴性和假阴性.

如果一个病人检测出生病，则为真阳性 (True Positive ，TP)

如果一个病人检测为健康，则为假阴性（False Negative，FN）；

如果一个健康人检测出生病，称为假阳性 (False Positive，FP)；

如果一个健康人检测为健康，称为真阴性（True Negative，TN）

由上面四种状态构成的矩阵称之为混淆矩阵。

再看一个检测垃圾邮件的例子：

上图是对应的混淆矩阵，假设一封邮件检测出是垃圾邮件时候称为阳性，那么

当一封垃圾邮件被检测出是垃圾邮件的时候称为真阳性（True Positive ，TP）；

当一封垃圾邮件被检测出是正常邮件时候称为假阴性（False Negative，FN）；

当一封正常的邮件被检测出是垃圾邮件时候

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。