性能度量

给定一组待测试的样本,该样本数据共有NNN个,其中∣p∣|p|p个正样本,∣n∣|n|n个负样本,经训练模型测试后,预测出∣ep∣|ep|ep个正例,∣en∣|en|en个负例。

1. Accuracy

准确率代表了预测准确的样本个数;
TP=∣p∩ep∣      TN=∣n∩en∣TP = |p\cap ep|\ \ \ \ \ \ TN = |n\cap en|TP=pep      TN=nen
Accuracy=TP+TNNAccuracy = \frac{TP+TN}{N}Accuracy=NTP+TN
准确率在样本分布不均衡时,无法较好地衡量该模型的好坏。

2. Precision, Recall

查准率(precisionprecisionprecision)是指在预测出的正结果中,有多少是正确的;
FP=∣ep−p∩ep∣FP = |ep-p\cap ep|FP=eppep
precision=TP∣ep∣=TPFP+TPprecision = \frac{TP}{|ep|}=\frac{TP}{FP+TP}precision=epTP=FP+TPTP
查全率(recallrecallrecall)是指在所有的正样本中,有多少被准确预测出来;
FN=∣p−p∩ep∣FN = |p-p\cap ep|FN=ppep
recall=TP∣p∣=TPFN+TPrecall=\frac{TP}{|p|}=\frac{TP}{FN+TP}recall=pTP=FN+TPTP
将模型预测的结果进行排序,按顺序逐个把样本作为正例进行预测,每次都可得到当前预测结果下的presicionpresicionpresicionrecallrecallrecall,然后以presicionpresicionpresicionrecallrecallrecall为纵横坐标轴,就可画出P-R曲线。

3. 真正率(TPR), 假正率(FPR)

真正率指在所有的正样本中,被准确预测出来为正的样本有多少,也就是,查全率;
TPR=TPFN+TPTPR=\frac{TP}{FN+TP}TPR=FN+TPTP
假正率指在所有的负样本中,被预测出为正的样本有多少。
TN=∣n∩en∣TN = |n\cap en|TN=nen
TPR=TPFP+TNTPR=\frac{TP}{FP+TN}TPR=FP+TNTP
将模型预测的结果进行排序,按顺序逐个把样本作为正例进行预测,每次都可得到当前预测结果下的TPRTPRTPRFPRFPRFPR,然后以TPRTPRTPRFPRFPRFPR为纵横坐标轴,就可画出ROC曲线,曲线下的面积就是AUC。

4. 看图理解

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值