一、描述性统计分析
1、峰度与偏度
网上找了一些相关资料
2、aggregate()
aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE)
将x
按by
分组后将FUN
作用于每一个子集上,其中by
是一个list,使用时要将组别转化为list格式,
simplify
控制数据是否将结果简化为向量或矩阵。
3、by
by(data, INDICES, FUN, ..., simplify = TRUE)
by
功能类似于aggregate
,但by
中FUN
可以返回多个值,而aggregate
中的FUN
只能是返回单值的函数
3、describe(){Hmisc}
;stat.desc(){pastecs}
;describe(){psych}
一些描述性统计函数,功能类似于summary,返回一系列描述性统计值,具体详见R语言实战7.1
二、检验
1、卡方检验(独立性检验)
chisq.test()
chisq.test(x, y = NULL, correct = TRUE,p = rep(1/length(x), length(x)), rescale.p = FALSE,
simulate.p.value = FALSE, B = 2000)
x可以为一列联表,进行卡方检验,也可以是x,y分别为需要检验的向量,检验他们是否独立
一般p<0.5,认为它们不独立
链接1(卡方检验)
链接2(卡方检验的应用)
2、