在R语言中执行交叉验证以评估模型性能
交叉验证是一种常用的评估机器学习模型性能的方法。它通过将数据集划分为训练集和测试集,并多次重复这个过程,以获得更稳健的性能评估结果。在R语言中,我们可以使用一些包来执行交叉验证,例如caret
和tidymodels
。
下面将介绍如何使用这两个包在R中执行交叉验证,并提供相应的源代码。
- 使用
caret
包执行交叉验证:
# 安装并加载`caret`包
install.packages("caret")
library(caret)
# 创建数据集
data <- iris
# 设置交叉验证参数
control <- trainControl(method = "cv", # 选择交叉验证方法
number = 5) # 设置交叉验证的折数
# 在交叉验证下训练模型
model <- train(Species ~ ., # 设置模型公式
data = data, # 设置数据集
trControl = control) # 设置交叉验证参数
# 输出交叉验证的结果
print(model)
在上述代码中ÿ