ROC曲线绘制及最佳阈值计算 - R语言实现
在机器学习中,评估模型的性能是十分重要的一环。而常用的评估指标之一就是ROC曲线(Receiver Operating Characteristic Curve)。ROC曲线能够帮助我们对二分类模型进行性能评估,并且通过选择最佳阈值,进一步优化模型的表现。本文将介绍如何使用R语言绘制ROC曲线并计算最佳阈值。
首先,我们需要准备一些数据来演示。假设我们有一个二分类模型预测人们是否患有某种疾病,我们已经得到了一组测试数据以及相应的预测概率值。我们将使用这些数据来绘制ROC曲线并计算最佳阈值。以下是模拟数据的示例:
# 模拟数据
actual_labels <- c(1, 0, 1, 0, 1, 1, 0, 1, 0, 1)
predicted_probs <- c(0.75, 0.65, 0.90, 0.40, 0.60, 0.85, 0.30, 0.70, 0.50, 0.80)
接下来,我们使用pROC
包来计算ROC曲线上的各个点,并绘制出完整的ROC曲线。确保已经安装了pROC
包,如果没有安装可以使用以下代码进行安装:
install.packages("pROC")
以下是绘制ROC曲线的代码:<