Python应用|ROC曲线,AUC计算及代码

本文介绍了ROC曲线和AUC的概念,ROC曲线用于评估分类模型性能,AUC值越大表示模型效果越好。文章详细阐述了真正例、假正例等基本概念,并提供了Python使用sklearn.metrics进行ROC曲线绘制和AUC值计算的实践方法,包括相关代码示例和数据来源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据类笔试题:Python绘制ROC曲线和计算AUC


这是我最近应聘某家互联网公司时遇到的笔试题:用Python或者R绘制ROC曲线并计算AUC.

1. 基本介绍

##1.1 ROC
Receiver Operating Characteristic,评判分类模型性能的方法,通过画在二维平面的曲线表示,横坐标为FPR(false positive rate,0~1),纵坐标为TPR(true positive rate,0~1)。

1.2 AUC

Area Under Curve,ROC曲线下面的面积,用来度量分类模型好坏的一个标准,值越大则分类模型效果越好。

针对二分类的问题,实例一般分为正类和负类,但通常还会被被分为以下四种情况:
(1)真正类(TP):实例是正类,被预测为正类;
(2)假负类(FN):实例是正类,被预测为负类;
(1)假正类(FP):实例是负类,被预测为正类;
(2)真负类(TN):实例是负类,被预测为负类。

1.3 ROC坐标点

横坐标(真正率):FPR=FP/(FP+TN)
纵坐标(假正率):TPR=TP/(TP+FN)
理想坐标点:TRP=1, FRP=0.

2. Python实现

主要需要理解sklearn.metrics有roc_curve, auc两个函数。
(1)ROC曲线绘制:

FPR,TPR,threshold=roc_curve(test,score,pos_label=1)

其中:

FPR:横坐标值
TPR:纵坐标值
threshold:阈值
test:测试集的结果
score:测试集预测的结果
pos_label=1:测试集值为1的是正类,其余为负类

(2)AUC值计算:

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值