R语言随机抽样:实现数据抽样的方法与代码
在数据分析和统计学中,随机抽样是一种常用的技术,用于从总体中选择一个随机样本。R语言提供了多种方法来实现随机抽样,本文将介绍其中的几种常见方法,并给出相应的源代码示例。
- 简单随机抽样(Simple Random Sampling)
简单随机抽样是从总体中以相等的概率选择样本的方法。在R语言中,可以使用sample()
函数来实现简单随机抽样。下面是一个简单随机抽样的示例代码:
# 创建一个向量
population <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
# 从总体中随机选择5个样本
sampled_data <- sample(population, size = 5, replace = FALSE)
在上面的代码中,population
是总体数据,size
参数指定了要选择的样本数量,replace
参数设置为FALSE
表示不允许重复抽样。
- 分层随机抽样(Stratified Random Sampling)
分层随机抽样是将总体分为若干个层次(或分组),然后从每个层