机器学习——性能评估方法(1)

机器学习——性能评估方法(1)

对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价标准,这就是性能度量(performance measure).本节主要包含:查准率、查全率、F1、ROC、AUC以及代价敏感错误率曲线。

——周志华老师机器学习西瓜书的一些总结与备忘。

查准率、查全率与F1

对于二分类问题,可将样例根据其真实类别与学习器预测类别的组合划分为真正例(true positive) 、假正例 (false positive) 、真反倒(true negative)、假反例 (false negative) 四种情形。用TP 、FP 、TN 、FN 表示。

真实情况 预测结果
正例 反例
正例 TP(真正例) FN(假反例)
反例 FP(假正例) TN(真反例)

查准率 P与查全率 R 分别定义:
P = T P T P + F P P=\frac{TP}{TP+FP} P=TP+FPTP

R = T P T P + F N R = \frac{TP}{TP+FN} R=TP+FNTP

P-R曲线

  • 若一个学 习器的 P-R 曲线被另一个学习器的曲线完全包住, 则可断言后者的性能优于前者。

  • 如发生交叉,则一般难以断言孰优孰劣,只能在具体的查全与查准率下比较。

  • “平衡点”(Break-Event Point ,BEP)图中斜线就是一个比较模型优劣的度量方法。

  • F1度量(更常用):
    F 1 = 2 × P × R P + R = 2 × T P 样 例 总 数 + T P − T N = 2 × T P F P + F N + 2 × T P F1 = \frac{2\times P\times R}{P+R}=\frac{2\times TP}{样例总数+TP-TN}=\frac{2\times TP}{FP+FN+2\times TP} F1=P+R2×P×R=+TPTN2×TP=FP+FN+2×TP2×TP
    F1 是基于查准率与查全率的调和平均 *(harinonicmean)*定义的:
    1 F 1 = 1 2 ( 1 R + 1 P ) \frac{1}{F1}=\frac{1}{2}(\frac{1}{R}+\frac{1}{P}) F11=21(R1+

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

love小酒窝

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值