R语言数据处理与可视化全解析
1. 数据子集选取
在R语言中,我们可以使用 subset() 函数来选取数据的子集。例如:
sub<-subset(df1, df1$a>5); sub
## a b
## 3 7 NA
## 4 6 9
## 5 8 8
上述代码选取了 df1 数据框中 a 列大于5的行。另外,还可以使用 select 参数来选取或排除某些列:
sub<-subset(df1, select=-a)
sub
## b
## 1 1
## 2 1
## 3 NA
## 4 9
## 5 8
这里排除了 a 列,只保留了 b 列。
2. 随机抽样
sample() 函数可用于对向量进行随机抽样。其基本用法如下:
v
## [1] 1 2 4 2 2 5 6 4 7 8 8
sample(df1$a, 20, replace = T)
## [1] 7 8 1 6 1 1 7 8 1 7 8 1 6 7 8 7 1 6 8 8
当 replace = T 时,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



