R语言在数据预测、统计分析与概率分布中的应用
1. 用决策树预测乘客生存情况
1.1 准备工作
使用之前用过的 train.data 数据进行后续操作。
1.2 操作步骤
- 构建数据分割函数 :
split.data = function(data, p = 0.7, s = 666){
set.seed(s)
index = sample(1:dim(data)[1])
train = data[index[1:floor(dim(data)[1] * p)], ]
test = data[index[((ceiling(dim(data)[1] * p)) + 1):dim(data)[1]], ]
return(list(train = train, test = test))
}
该函数有三个输入参数: data 代表输入数据集, p 代表从输入数据集中生成子集的比例, s 代表随机种子。
2. 分割数据 :
allset= split.data(train.data, p = 0.7)
trainset = allset$train
testset = allset$test
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



