ROC曲线

最新推荐文章于 2023-08-11 14:02:01 发布

转载最新推荐文章于 2023-08-11 14:02:01 发布 · 793 阅读

R 专栏收录该内容

35 篇文章

订阅专栏

http://blog.youkuaiyun.com/sinat_26917383/article/details/51114244

http://blog.youkuaiyun.com/dingming001/article/details/72956044

http://blog.youkuaiyun.com/solo7773/article/details/8699693

自己运算

# 做一个logistic回归，生成概率预测值
model1 <- glm(y~., data=newdata, family='binomial')
pre <- predict(model1,type='response')
# 将预测概率prob和实际结果y放在一个数据框中
data <- data.frame(prob=pre,obs=newdata$y)
# 按预测概率从低到高排序
data <- data[order(data$prob),]
n <- nrow(data)
tpr <- fpr <- rep(0,n)
# 根据不同的临界值threshold来计算TPR和FPR，之后绘制成图
for (i in 1:n) {
threshold <- data$prob[i]
tp <- sum(data$prob > threshold & data$obs == 1)
fp <- sum(data$prob > threshold & data$obs == 0)
tn <- sum(data$prob < threshold & data$obs == 0)
fn <- sum(data$prob < threshold & data$obs == 1)
tpr[i] <- tp/(tp+fn) # 真正率
fpr[i] <- fp/(tn+fp) # 假正率
}
plot(fpr,tpr,type='l')
abline(a=0,b=1)

2、ROCR包

R中也有专门用来绘制ROC曲线的包，例如常见的ROCR包，它不仅可以用来画图，还能计算ROC曲线下面积AUC，以评价分类器的综合性能，该数值取0-1之间，越大越好。

library(ROCR)
pred <- prediction(pre,newdata$y)
performance(pred,'auc')@y.values #AUC值
perf <- performance(pred,'tpr','fpr')
plot(perf)

注意：其中pre是分类器预测的模型，而newdata$y是实际值。

3、pROC包

ROCR包画图函数功能比较单一，笔者比较偏好使用功能更强大的pROC包。它可以方便比较两个分类器，还能自动标注出最优的临界点，图看起来也比较漂亮

library(pROC)
modelroc <- roc(newdata$y,pre)
plot(modelroc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),
grid.col=c("green", "red"), max.auc.polygon=TRUE,
auc.polygon.col="skyblue", print.thres=TRUE)

R语言绘制ROC曲线如何画在一个图中

library("pROC")

data(aSAH) 加载R语言自带的数据

roc1 <- roc(myData$label, myData$score)

roc2 <- roc(myData2$label, myData2$score)

plot(roc1, col="blue")

plot.roc(roc2, add=TRUE, col="red") 在上图中继续添加ROC曲线

head(aSAH)
roc(aSAH$outcome, aSAH$s100b)
roc(aSAH$outcome, aSAH$s100b, plot=TRUE, print.thres=TRUE, print.auc=TRUE)

R语言利用caret包比较ROC曲线

control = trainControl(method = "repaetedcv",

number = 10,

ROC曲线

R语言绘制ROC曲线如何画在一个图中

R语言利用caret包比较ROC曲线

control = trainControl(method = "repaetedcv",

number = 10,

repeats =3,

classProbs = TRUE,

summaryFunction = twoClassSummary)

glm.model = train(churn ~ .,

data= trainset,

method = "glm",

metric = "ROC",

trControl = control)

svm.model = train(churn ~ ., data= trainset, method = "svmRadial",

metric = "ROC", trControl = control)

rpart.model = train(churn ~ ., data = trainset, method = "svmRadial",

metric = "ROC", trControl = control)

glm.probs = predict(glm.model,testset[,!names(testset) %in% c("churn")],type = "prob")

svm.probs = predict(svm.model,testset[,!names(testset) %in% c("churn")],type = "prob")

rpart.probs = predict(rpart.model,testset[,!names(testset) %in% c("churn")],type = "prob")

生成每个模型的ROC曲线，将它们绘制在一个图中：

glm.ROC = roc(response = testset[,c("churn")],

predictor = glm.probs$yes,

levels = levels(testset[,c("churn")]))

plot(glm.ROC,type = "S",col = "red")

svm.ROC = roc(response = testset[,c("churn")],

predictor = svm.probs$yes,

levels = levels(testset[,c("churn")]))

plot(svm.ROC,add = TRUE,col = "green")

rpart.ROC = roc(response = testset[,c("churn")],

predictor = rpart.probs$yes,

levels = levels(testset[,c("churn")]))

plot(rpart.ROC,add = TRUE,col = "blue")