df为1个data.frame对象,有stratum和psu两列,这里统计stratum列计数
方法1:
cnt = table(df$stratum)
方法2:
cnt = tapply(df$psu, INDEX=df$stratum, FUN=length)
在方法2的基础上,只要改变FUN函数就可以实现分组求和、求均值等功能,如下
分组求均值:
tapply(df$psu, INDEX=df$stratum, FUN=mean)
#(等价于python中的df.groupby('stratum').psu.mean)
博客围绕data.frame对象df展开,其包含stratum和psu两列。介绍了统计stratum列计数的两种方法,还指出在方法2基础上,通过改变FUN函数可实现分组求和、求均值等功能,如分组求均值。
882

被折叠的 条评论
为什么被折叠?



