方差分析的原理:原本想跳过这个部分的,然而突然发现自己看懂了这些公式,就忍不住写出来。
(1)Xij=X均值+(X组内均值-X均值)+(Xij-X组内均值) #Xij代表第i组第j个观察值,X均值代表所有观察值的均值,X组内均值就是每组内部的均值。可以看到打开括号就是成立的,只是巧妙的引入了组内均值和组间均值。
(2)SSD总=SSD组内+SSD组间 #把X组内均值-X均值的方差计算出来,构成组间方差SSD组间;把Xij-X组内均值的方差计算出来,构成组内方差SSD组内。可以通过公式的转换证明出 SSD总=SSD组内+SSD组间。
(3)MS组内=SSD组内/(n-k),MS组间=SSD组间/(k-1)# k代表分组个数,n代表所有的观测值个数,MS代表平均方差。构造时的SSD是符合正态分布的,所以MS也是符合正态分布的。组内差异我们可以通过规定数据的正态性和方差齐性来使值固定下来,而MS组间就是我们的原假设,即假设各组方差齐。
(4)F=MS组间/MS组内 #这里构造了一个F分布,在最理想的情况下,组内差异无,为1,组间差异无,为1,即F=1。当MS组间的平均均值超过显著性,那么F就会落到95%分布以外的区域,这时就可以认为各组方差不全相等。ANOVA分析由于是Fisher发明的,又称为F检验。
好开心,自己终于有点理解了,之前总是听不懂。建议大家跳过这个部分,直接看下面。
单因素方差分析:
应用条件:(1)符合正态性分布(2)各组组内方差齐。
这里常规用的是aov(),支持formula。
代码例子:aov(folate ~ ventilation) ,然后用summary()查看 #组间差异p=0.0436
这里的aov()输出的是1个模型,所以得配合summary显示。这里还有1个骚操作,就是anova(),官方定义:计算一个或多个拟合模型对象的方差(或偏差)表的分析。划重点:模型对象,方差表。
代码例子:anova(lm(folate ~ ventilation)) #p=0.04359
有意思的地方来了,这就是医学统计数上没讲到的点,即方差分析和线性回归都属于一般线性模型。有关这方面的内容,有个博主讲的已经很透彻了
R中的假设检验(二)方差分析
最新推荐文章于 2024-01-18 01:00:00 发布
本文深入解析方差分析的原理,涵盖单因素方差分析的应用条件、ANOVA分析、多重检验方法如LSD、Tukey、SNK等,以及非参数方差分析。通过实例展示R语言中的方差分析操作,包括aov、LSD.test、TukeyHSD等函数的使用。

最低0.47元/天 解锁文章
1840





