R语言统计分析与常见术语解析
1. R中的统计分析
在R语言里, plot
函数可提供合适的诊断图,例如执行 plot(myModel)
就能实现。不过,在R中可以进行更复杂的方差分析(ANOVA)模型,但这超出了本文范畴。若想深入了解ANOVA,可参考相关资料。
1.1 平方和
在方差分析里,Stata默认提供偏(III型)平方和与F检验,同时也可选择序贯平方和与F检验。而R的内置函数提供序贯平方和。对于单向ANOVA或者等单元格大小的双向及更高阶ANOVA,序贯检验和偏检验并无差异。然而,在单元格计数不等的双向或更高阶模型(非平衡模型)中,这两种平方和会导致不同的F检验和p值。
R社区普遍认为基于偏平方和的检验可能会产生误导。III型检验的一个问题是,它在剔除显著交互作用后检验主效应,在很多情况下,这并无太大意义。若你确定需要III型平方和,可使用John Fox的 car
包中的 Anova
函数来计算。具体操作步骤如下:
# 加载car包
library("car")
# 使用Anova函数计算III型平方和
Anova(myModel, type="III")
在执行上述代码时,若 car
包中的 recode
函数屏蔽了 Hmisc
包中的同名函数,虽会有提示信息,但不影响所需功能。
为了在进行更复杂的ANOV