机器学习:有关分类模型的准确率、召回率、精确率介绍

前言
  • 如果你了解混淆矩阵(误差矩阵),那更好,如果你不了解,我也不会介绍,请自行查找或者参考:混淆矩阵
提要
  • 模拟一个机器学习案例:我们假设要做一个预测是否为癌症的案例,特征值是:身体的各项素质,目标值是:是否为癌症(分类问题)。
  • 那么此时如何衡量这个模型的好坏?
  • 由此引出:准确率、召回率、精确率、还有稳健型F1
  • 下面结合假设的预测案例,来介绍这几个标准。
正文
  • 先了解有关的几个定义:
类别定义案例
真正例(TP )实际上是正例的数据点被标记为正例实际上为癌症的被预测为癌症了
假正例(FP)实际上是反例的数据点被标记为正例实际上不是癌症却被预测为癌症了
真反例(TN)实际上是反例的数据点被标记为反例实际上不是癌症也确实预测为不是癌症
假反例(FN)实际上是正例的数据点被标记为反例实际是癌症却被预测是不是癌症
  • 那么再看下面一个表:
类别特点定义案例公式应用场景
准确率默认真实为正例和真实为反例的数据和总数据的比例。预测正确的和全部的比例(真正例+真反例)/(真正例+真反例+伪正例+伪反例)
召回率查的全真实为正例的样本中预测结果为正例的比例预测为癌症且本来就是癌症和本来就是癌症的比例(存在是癌症却预测为不是癌症的数据(假反例)真正例/(真正例+假反例)还行
精确率查的准预测结果为正例的样本和真实为正例的比例真为癌症和预测结果为癌症的比例(存在不是癌症却预测是癌症的数据(假正例)真正例/(真正例+假正例)
稳健型F1综合评判标准,越高越好为了权衡召回率和精确率之间的权衡无,参照公式即可。F1=2TP/(2TP+FN+FP)=(2 * 精确率 * 召回率)/(精确率+召回率)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值