数据抽样smaple、等比抽样 (根据谢佳标老师课程整理)

本文介绍了如何在R中使用sample函数进行数据的随机抽样,包括非放回抽样的应用。此外,还探讨了通过抽取行号创建新数据集的方法,并提到了计算列联表比例的技巧,如利用prop.table()函数。同时,文章讲解了等比例抽样的实现,特别是使用createDataPartition()函数,并讨论了list参数的设置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.R 中的sample函数可以实现数据的随机抽样。

sample(x, size, replace = FALSE, prob = NULL)

x  表示向量或多个元素

size  抽样的个数大小。replace=FALSE 非放回抽样。
2.对样本进行抽样的一般做法。

> x1<-read.csv("E:\\Users\\Administrator\\Desktop\\sample1.csv",sep="\t",head=FALSE)
> head(x1)
      V1  V2          V3       V4         V5  V6
1 377563  67      520.16      \\N        \\N   1
2 377573 253  1422982.89      \\N        \\N  39
3 377574 336 19928643.68 84134.79 4760172.00  86
4 377575 147    13918.69      \\N        \\N \\N
5 377576  56      288.06      \\N        \\N   1
6 377579 141        0.00      \\N        \\N \\N
> nrow(x1)
[1] 65800
> set.seed(1234)
> index<-sample(x,10000,replace=TRUE)
> x_sample<-x1[index,]
这样抽样对吗? 从x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值