受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。
ROC可以用于:(1)比较预测二分类响应变量的预测效果;(2)获取预测二分类响应变量的连续预测变量的阈值。
比如在预测病人有无高血压时,有无高血压为二分类的响应变量:有或无,使用测量的血压值为预测变量,血压值为连续变量。
假如还想通过体重来预测有无高血压,那么要比较这两个模型:血压值及体重究竟哪个指标能更好的预测有无高血压就是用途(1),而选择哪一个数值是比较好的界定“有无高血压”的阈值,就是用途(2)。
ROCR包与ROC
一个用于分析ROC的数据是一组连续变量和一组二分类变量,连续变量是预测变量,分类变量是响应变量。
在ROCR包中,这两组数据被称为“predictions“和”labels“。
如下所示为ROCR包的示例数据ROCR.sample。
# 载入工具包
library(tidyverse)
library(ROCR)
data(ROCR.simple)
ROCR.simple %>% as_tibble
# # A tibble: 200 x 2
# predictions labels
#
# 1 0.613 &nb

ROC曲线用于评估二分类响应变量的预测效果,例如比较不同预测指标(如血压值和体重)在预测高血压中的作用。ROCR包提供分析ROC数据的功能,包括prediction对象、性能计算和绘图。通过TPR和FPR计算,ROC曲线的AUC可衡量预测能力,0.5-0.9的AUC表示不同级别的预测能力。ROCR包主要涉及prediction、performance和plot三个函数,可用于计算和展示ROC曲线。
最低0.47元/天 解锁文章
2994

被折叠的 条评论
为什么被折叠?



