1.R 中的sample函数可以实现数据的随机抽样。
sample(x, size, replace = FALSE, prob = NULL)
x 表示向量或多个元素
size 抽样的个数大小。replace=FALSE 非放回抽样。
2.对样本进行抽样的一般做法。
> x1<-read.csv("E:\\Users\\Administrator\\Desktop\\sample1.csv",sep="\t",head=FALSE)
> head(x1)
V1 V2 V3 V4 V5 V6
1 377563 67 520.16 \\N \\N 1
2 377573 253 1422982.89 \\N \\N 39
3 377574 336 19928643.68 84134.79 4760172.00 86
4 377575 147 13918.69 \\N \\N \\N
5 377576 56 288.06 \\N \\N 1
6 377579 141 0.00 \\N \\N \\N
> nrow(x1)
[1] 65800
> set.seed(1234)
> index<-sample(x,10000,replace=TRUE)
> x_sample<-x1[index,]
这样抽样对吗? 从x