library(dplyr)
df = read.csv('R/play.csv')
#通过subset获取子集
ydf <- subset(df, Play == "yes")
ndf <- subset(df, Play == "no" )
#通过sample_n随机抽样
ysample <- sample_n(ydf, 5)
nsample <- sample_n(ndf, 5)
#通过rbind合并正负样本
sp <- rbind(ysample, nsample)
sample()的replace=FALSE可以无放回的抽样。
本文介绍如何使用R语言中的dplyr包进行数据子集的抽取与合并操作,包括利用subset函数选取特定条件的子集,使用sample_n进行随机抽样,以及通过rbind函数合并不同类型的样本。
516

被折叠的 条评论
为什么被折叠?



