R语言中的抽样方法与描述统计函数

本文介绍了R语言中的抽样方法,包括简单随机抽样、分层抽样和系统抽样,并详细讲解了如何使用sample函数进行操作。在描述统计部分,提到了summary函数、Hmisc包的describe函数以及pastecs包的stat.desc函数,这些工具能方便地获取数据的多种统计量。通过学习,你可以更高效地分析和理解数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

抽样方法

常见的抽样方法

  • 简单随机抽样
  • 分层抽样
  • 系统抽样
# 导入数据
# 1 金融  2 建筑   3 外语
data <- read.csv("E:\\Github\\code-learning\\R\\data\\第11期资料\\data.csv")
# 按照专业和ID排序
data <- data[order(data$专业,data$ID),]
head(data)
专业 ID 收入
375 1 A001 6811
360 1 A002 3976
505 1 A003 2692
470 1 A004 8156
214 1 A005 2169
450 1 A006 6142

简单随机抽样

简单随机抽样最基本的抽样方法。分为重复抽样和不重复抽样。社会调查采用不重复抽样。

sample(x,size,replace=FALSE,prob=NULL)

  • x :抽样总体
  • size: 样本容量
  • replace: 是否有放回
  • prob: 抽样概率,默认等概率

使用sample函数要将数据按照升序排序

# 对数据序号抽样
# 无放回的抽取10个样本
index_11 <- sample(1:nrow(data),10,replace = FALSE)
index_11
data[index_11,]
  1. 202
  2. 181
  3. 392
  4. 222
  5. 22
  6. 117
  7. 190
  8. 247
  9. 135
  10. 169
专业 ID 收入
65 2 B102 8522
369 2 B081 8386
309 3 C092 6151
169 2 B122 6439
392 1 A022 4371
41 2 B017 4203
428 2 B090 5392
44 2 B147 3291
402 2 B035 7097
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值