ind=sample(2,nrow(dataset),replace=TRUE,prob=c(0.7,0.3))
data_train=dataset[ind==1,]
data_test=dataset[ind==2,]
R语言中的sample()函数是用于随机采样的函数。
函数模型:sample(x, size, replace = FALSE, prob = NULL)
x参数为一个向量,其中包含一个以上的元素;也可以为一个整数,如果为整数(N),采样范围为1:N,包括N本身。
size,即采样次数
replace表示是否重复采样,默认为FALSE,如果为TRUE,则表示为放回采样。
prob参数可以设置x中每个元素被sample的概率。
本文详细介绍R语言中sample()函数的应用,该函数用于实现数据集的随机抽样,包括如何设定抽样次数、是否重复抽样及各元素被抽中的概率等关键参数。
4425

被折叠的 条评论
为什么被折叠?



