【R语言】ROC检验（与随机猜测，即AUC=0.5比较）

最新推荐文章于 2025-04-21 22:30:58 发布

翻译最新推荐文章于 2025-04-21 22:30:58 发布 · 1.9k 阅读

3 ·

CC 4.0 BY-SA版权

原文链接：https://www.rdocumentation.org/packages/verification/versions/1.42/topics/roc.area

统计检验及R语言专栏收录该内容

10 篇文章

订阅专栏

本文介绍如何使用R语言中的verification包的roc.area函数来计算ROC曲线下的面积（AUC），包括处理有和无平局的情况。通过示例数据集展示函数的使用方法，输出AUC值、样本数量、正负样本数及P值。

来源

包：verification
函数：roc.area
官方文档：https://www.rdocumentation.org/packages/verification/versions/1.42/topics/roc.area

参数

obs：标签（0 或 1）
pred：预测值（0-1之间的概率）

输出

A： AUC值
n.total：总的样本个数
n.events：正样本个数
n.noevents：负样本个数
p.value： P值（与随机猜测，即AUC=0.5比较）

样例

a<- c(1981, 1982, 1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990,
 1991, 1992, 1993, 1994, 1995)
b<- c(0,0,0,1,1,1,0,1,1,0,0,0,0,1,1)
c<- c(.8, .8, 0, 1,1,.6, .4, .8, 0, 0, .2, 0, 0, 1,1)
d<- c(.928,.576, .008, .944, .832, .816, .136, .584, .032, .016, .28, .024, 0, .984, .952)

A<- data.frame(a,b,c, d)
names(A)<- c("year", "event", "p1", "p2")

## for model with ties
roc.area(A$event, A$p1)

## for model without ties
roc.area(A$event, A$p2)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

JianJuly

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

机器学习中的模型评估：ROC曲线与AUC值的深度解析

加入“Super Entity”，与全能开发团队共探AI智能体与数字人项目，开启前沿技术之旅。

03-20

2607

在机器学习项目中，评估模型的性能是确保模型有效性和可靠性的关键步骤。ROC曲线（Receiver Operating Characteristic Curve）和AUC值（Area Under Curve）是评估分类模型性能的重要工具，尤其是在处理不平衡数据集时。ROC曲线展示了模型在不同阈值下的真正例率（TPR）和假正例率（FPR），而AUC值则表示ROC曲线下的面积，用于衡量模型的整体性能。本文将从ROC曲线和AUC值的基本概念出发，通过一个完整的代码示例带你入门，并探讨其应用场景和注意事项。

AUCROC 原理与代码实战案例讲解

AI天才研究院

08-09

965

AUC-ROC 原理与代码实战案例讲解 1. 背景介绍在机器学习和数据挖掘领域中,评估模型的性能是一个非常重要的环节。对于二分类问题,我们常常使用准确率(Accuracy)作为模型评估指标。然而,准确率只能给出模型整体的正确率,无法反映出正负样本之间的权衡情况。因此,我们需要一个更

参与评论您还未登录，请先登录后发表或查看评论

ROC(AUC)的显著性检验

医学和生信笔记的博客

09-15

1万+

本文首发于公众号：医学和生信笔记 “ 医学和生信笔记，专注R语言在临床医学中的使用，R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。 R语言临床预测模型系列文章，目前已更新20+篇内容，持续更新中，欢迎订阅！今天说一说ROC(AUC)的比较。二分类资料的ROC比较可以通过pROC包实现的，使用其中roc.test()函数可实现两个ROC 的Delong检验。使用pROC包的aSAH数据，其中outcome列是结果变量，1代表Goo

ROC检验分类树性能

weixin_30567471的博客

07-25

158

001 ############################################################# 002 ############# 读取excel文件 ###################### 003 ############################################################# 0...

多分类的ROC曲线绘制思路

知识搬运者

05-11

9685

我们通常说的ROC曲线的中文全称叫做接收者操作特征曲线（receiver operating characteristic curve），也被称为感受性曲线。该曲线有两个维度，横轴为fpr（假正率），纵轴为tpr（真正率）这幅曲线的每个点都对应一个（fpr，tpr），看过之前混淆矩阵的话，感觉一堆数据好像最终只能算出一个fpr和tpr，那是如何获得这么多的点的呢？我们y会有一个预测为正类的概率。

利用ROC检验算法准确性流程

xiaohuaibao的博客

05-17

4779

1. 数据准备检验需要一定数量手工标定的数据。以人眼检测算法检测为例，数据存放在Data文件夹中。标定结果按照下面格式写入markedresult.txt。 Image1//图像名称 2//目标数量 460 327 527 351 1//目标1所在矩形，第五个数字1代表分数，标定数据都是1 1680 341 511 340 1//目标2所在矩形讲所有数据的

R语言快速画出ROC曲线和算出可信区间和p值

笑不语的博客

03-16

8159

R语言快速画出ROC曲线，并获取最佳截断值、敏感度、特异度、95%可信区间、AUC和p值

算法金 | 一文彻底理解机器学习 ROC-AUC 指标

算法金「全网同名」的博客

06-11

1965

ROC 曲线，即接收者操作特征曲线，ROC曲线产生于第二次世界大战期间，最早用在信号检测领域，侦测战场上的敌军载具（飞机、船舰）。现在是是用来评价二分类模型性能的常用图形工具。它通过显示真阳性率（True Positive Rate，简称 TPR）与假阳性率（False Positive Rate，简称 FPR）之间的权衡来帮助我们理解模型的分类能力。AUC，即曲线下面积（Area Under Curve），是 ROC 曲线下面积的一个数值表示。它提供了一个定量的指标，用来衡量分类模型的整体表现。

一文彻底理解机器学习 ROC-AUC 指标

最新发布

Y20220816的博客

04-21

1276

AUC（Area Under the Curve）**是评估二分类模型性能的核心工具，尤其在疾病诊断、风险预测等场景中广泛应用。在医学、机器学习以及统计学中，**ROC曲线（Receiver Operating Characteristic Curve）特异度（Specificity）**随分类阈值变化的关系，反映模型在不同阈值下区分正负类的能力。ROC曲线通过可视化模型的**敏感度（Sensitivity）

检验两个ROC曲线的差异是否具有统计显著性（Python）

WELL_CODER的博客

09-10

664

ROC曲线可以帮助我们理解分类器在不同阈值下的性能，并比较不同分类器的性能。然而，当我们比较两个ROC曲线时，我们也希望知道它们之间的差异是否具有统计显著性。根据Wilcoxon秩和检验的结果，如果p-value小于我们选择的显著性水平（通常是0.05），则我们可以拒绝原假设，即两个ROC曲线没有显著差异。否则，如果p-value大于显著性水平，则我们无法拒绝原假设，即两个ROC曲线之间的差异不具有统计显著性。通过以上步骤，我们可以使用Python检验两个ROC曲线的差异是否具有统计显著性。

检验两个ROC曲线的差异是否具有统计显著性

2301_79326930的博客

08-19

656

综上所述，通过使用pROC包中的roc.test函数，我们可以在R语言中检验两个ROC曲线之间的差异是否具有统计显著性。此外，pROC包还提供了其他功能和图形工具，可以帮助我们更全面地分析和可视化ROC曲线的差异。接下来，我们可以使用roc.test函数进行两个ROC曲线之间的统计显著性检验。除了检验结果之外，我们还可以使用pROC包提供的其他函数和图形功能来进一步分析和可视化ROC曲线的差异。如果p值小于设定的显著性水平（通常为0.05），则可以认为两个ROC曲线之间的差异具有统计显著性。

R语言deLong‘s test：使用自定义函数检验两个ROC曲线的差异是否具有统计显著性、比较两个或多个相关ROC曲线的AUC的非参数检验

data+scenario+science+insight

11-02

5076

R语言deLong's test：使用自定义函数检验两个ROC曲线的差异是否具有统计显著性、比较两个或多个相关ROC曲线的AUC的非参数检验目录 R语言deLong's test：使用自定义函数检验两个ROC曲线的差异是否具有统计显著性、比较两个或多个相关ROC曲线的AUC的非参数检验 #deLong's test #deLong's test假设检验自定义函数说明 #deLong's test假设检验自定义函数 #deLong's test假设检验实例 #deLon..

R语言怎么比较两个模型C指数,手把手教你比较两个模型的预测能力

weixin_29129919的博客

05-22

4647

原标题：手把手教你比较两个模型的预测能力本文首发于“百味科研芝士”微信公众号，转载请注明：百味科研芝士，Focus科研人的百味需求。各位科研芝士的朋友，大家好。最近学习到用NRI进行模型比较，起初当听到NRI这个词的时候，我的表情可能是这样的。其实当时我还真不知道这个概念，不过奈何我们大家都爱学习，接着一顿操作猛如虎，来学习一个这个知识点，今天就把自己学习的一点，分享给大家，希望对大家能有帮助。...

SPSS新手教学——如何进行ROC分析

nekonekoboom的博客

07-21

1万+

一、简介 ROC分析主要用于诊断试验，诊断试验是指评价某种疾病诊断方法的临床试验。在医学上诊断试验结果的毫厘之差都会造成很严重的后果，医生在大量分析之后难免会出现疲劳的现象所以必须借助一些工具来辅助分析。这时候SPSS的ROC分析就起到了作用，可以帮助医生提高分析的正确率还可以节约时间。 ROC分析是SPSS为医学领域单独打造的功能，有学医的小伙伴可以拿来使用。接下来我将在IBM SPSS Statistics中，用几个简单的步骤演示如何进行ROC分析。二、步骤教学 1、打开数据下图是109份

R语言中常见函数解释

muli

04-09

8829

R语言中常见函数解释 subset()：从某一个数据框中，选择出符合某条件的数据或者相关列 # 提取wine数据集中除quality列以外的数据作为自变量 x=subset(wine,select=-quality) # 确定矩阵每行中最大值所在的列 prednew=max.col(pred) ...

roc曲线与auc值

04-13

<think>好的，用户想了解ROC曲线和AUC值的概念及其关系，包括定义、计算方法和在机器学习中的应用。我需要根据用户提供的四个引用资料来整理回答，确保准确引用相关内容。首先，明确ROC曲线的定义。引用[1]提到ROC曲线是接收者操作特征曲线，用于评估二分类模型在不同阈值下的表现。横轴是假正率，纵轴是真正率。需要解释每个轴的含义，以及曲线如何反映模型性能。接下来是AUC值的定义。引用[3]指出AUC是ROC曲线下的面积，用来量化模型的整体性能。值越大表示模型越好，1代表完美，0.5相当于随机猜测。需要强调AUC的意义和判断标准。关于两者的关系，引用[1]和[3]都说明ROC曲线展示不同阈值下的表现，而AUC提供一个综合指标。如果ROC曲线被另一条完全包住，则后者更优；若交叉，则需比较AUC。这部分需要结合引用内容详细说明。计算方法是重点之一。引用[4]提到Python中计算AUC的方法，比如梯形法则积分。同时引用[3]提到通过排序样本预测值，计算正样本排在负样本前的概率。需要分步骤解释如何绘制ROC曲线和计算AUC，包括具体公式和示例。机器学习中的应用部分，引用[2]和[4]指出AUC对不平衡数据的容忍度高，适合比较不同模型。需要提到常见库如scikit-learn中的实现，以及实际应用中的注意事项，比如数据分布和阈值选择。在生成相关问题时，需覆盖概念、计算、应用、比较和实际使用中的问题。确保问题能够引导用户进一步深入学习。最后，检查引用是否正确标注，确保每个引用标记对应正确的资料，并自然融入回答中。避免技术术语过于复杂，保持解释清晰易懂。同时注意格式要求，数学公式使用$...$，独立公式用$$...$$，如真正率公式需单独成段。现在整理结构：定义部分分ROC和AUC，关系部分说明互补作用，计算方法分步骤，应用场景和注意事项。相关问题覆盖定义、计算、应用、比较和工具使用。</think>### ROC曲线与AUC值的概念及其关系 #### 一、定义 1. **ROC曲线**（接收者操作特征曲线） ROC曲线以假正率（$FPR$）为横轴、真正率（$TPR$）为纵轴，描述二分类模型在不同分类阈值下的性能表现[^1]。其核心公式为： $$TPR = \frac{TP}{TP + FN}, \quad FPR = \frac{FP}{TN + FP}$$ 其中，$TP$（真正例）、$FN$（假反例）、$FP$（假正例）、$TN$（真反例）构成混淆矩阵。 2. **AUC值**（曲线下面积） AUC是ROC曲线下方的面积，用于量化模型的整体分类能力。AUC取值范围为$[0,1]$： - $AUC=1$：完美分类器； - $AUC=0.5$：相当于随机猜测； - $AUC>0.5$：模型优于随机分类[^3]。 #### 二、ROC曲线与AUC的关系 - **互补性**：ROC曲线展示模型在不同阈值下的表现，而AUC通过面积综合评估整体性能[^1]。 - **模型比较**： - 若模型A的ROC曲线完全包住模型B的曲线，则A的性能更优； - 若曲线交叉，需比较AUC值，AUC越大模型越好[^3]。 #### 三、计算方法 1. **ROC曲线绘制步骤**： - 对测试样本的预测概率从高到低排序； - 依次将每个概率作为阈值，计算对应的$TPR$和$FPR$； - 连接所有$(FPR, TPR)$点形成曲线[^4]。 2. **AUC计算**： - **积分法**：对ROC曲线进行梯形法则积分，公式为： $$AUC = \sum_{i=1}^{n} \frac{(FPR_i - FPR_{i-1}) \cdot (TPR_i + TPR_{i-1})}{2}$$ - **概率法**：随机选取一个正样本和一个负样本，AUC等于正样本预测概率高于负样本的概率[^3]。 #### 四、应用场景与注意事项 1. **适用场景**： - 二分类问题，尤其类别不平衡时（如欺诈检测、疾病诊断）[^2]； - 需要全面评估模型在不同阈值下的表现。 2. **注意事项**： - AUC对类别分布不敏感，但需结合业务需求选择阈值； - 若关注少数类（如癌症检测），需同时参考精确率-召回率曲线（P-R曲线）[^3]。 #### 示例代码（Python） ```python from sklearn.metrics import roc_curve, auc import matplotlib.pyplot as plt # 假设 y_true为真实标签，y_score为预测概率 fpr, tpr, thresholds = roc_curve(y_true, y_score) roc_auc = auc(fpr, tpr) plt.plot(fpr, tpr, label=f'AUC = {roc_auc:.2f}') plt.plot([0,1], [0,1], linestyle='--') plt.xlabel('False Positive Rate') plt.ylabel('True Positive Rate') plt.legend() plt.show() ```