数据分析中的模型验证、参数调整与交互项应用
1. 交叉验证
1.1 数据划分
在R语言中,可使用以下代码进行数据划分,得到训练集和验证集:
trainidxs <- sample(1:n, ntrain, replace = FALSE)
list(train = data[trainidxs, ],
valid = data[-trainidxs, ])
这里的 - 在数组索引中用于排除元素,例如:
x <- c(5, 12, 13)
x[-2]
输出结果为 [1] 5 13 ,通过 -trainidxs 可得到验证集数据。
1.2 线性模型的交叉验证
1.2.1 代码实现
xvallm <- function(data, ycol, predvars, p, meanabs = TRUE) {
tmp <- xvalpart(data, p)
train <- tmp$train
valid <- tmp$valid
trainy <- train[, ycol]
trainpreds <- train[, predvars]
trainpreds <- as.matrix(tr
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



