方差分析(analysis of variance,ANOVA)几乎是在统计学分析中最常用的方法,通过分析各变量的主效应(main effect)和交互效应(interaction effect),从而发现因变量(dependent variable)的变异源。另外,通过配合使用多重比较的检验方法,其也常用于比较不同处理导致的因变量的差异。
一、基本原理
假设我们实验获得了这样的一组数据:通过对研究对象(各实验单位)进行不同处理(控制各变量的水平),导致实验对象的某一指标(因变量)在实验单位间出现差异。同时,为了更好的探讨差异的来源,同时提高结果的可靠性,同样的处理我们做了多次重复(一般要大于3)。
1、数学模型
这样就可以将数据的变异划分为组内变异和组间变异,组内变异即各实验重复间的差异,由于随机误差导致。组间变异即各处理组之间的差异,由随机误差和处理效应导致。方差分析的基本思路就是将变异分解为组间变异和组内变异差异的大小(服从FFF分布),并使用FFF检验来比较二者差异的显著性。
设实验一共有k\red{k}k个处理,每个处理有n\red{n}n个重复,因此第i\red{i}i个处理的第j\red{j}j次重复的观测表示为xij\red{x_{ij}}xij,且有μ\muμ为总体平均数(μ=∑μik\mu=\frac{\sum\mu_{i}}{k}μ=k∑μi,kkk为处理数,μi\mu_{i}μi为各处理组的均值),αi\alpha_{i}αi为处理效应(样本为总体时,∑αi=0\sum\alpha_{i}=0∑αi=0),εij\varepsilon_{ij}εij为随机误差(相互独立且ε\varepsilonε~N(o,σ2)N(o,\sigma^{2})N(o,σ2)),则观测与变异间的关系可表示为:
xij=μ+αi+εijx_{ij}=\mu+\alpha_{i}+\varepsilon_{ij}xij=μ+αi+εij
使用样本统计数表示就是:
xij=x‾+αi+eij , eij:样本随机误差x_{ij}=\overline{x}+\alpha_{i}+e_{ij}~,~e_{ij:\text{样本随机误差}}xij=x+αi+eij , eij:样本随机误差
2、方差分解
在方差分析中,通常使用方差s2s^{2}s2来表征数据的变异,而方差通过平方和和自由度来计算:
S2=∑(xi−x‾)dfS^{2}=\frac{\sum(x_{i}-\overline x)}{df}S2=df∑(xi−x)
所以,将总变异分解为组间变异和组内变异实质上就是分解平方和和自由度。
(1)平方和的分解
沿用上述的例子,则总变异的平方和SST\red{SS_{T}}SST为:
SST=∑i=1k∑j=1n(xij−x‾)2SS_{T}= \sum_{i=1}^{k} \sum_{j=1}^{n} (x_{ij}-\overline x)^2SST=i=1∑kj=1∑n(x

方差分析是一种统计学方法,用于分析因变量的变异源,包括主效应和交互效应。它通过F检验比较组间和组内变异,以确定处理效应的显著性。在R中,可以使用aov函数进行方差分析,并通过LSD.test进行多重比较。此外,可视化结果通常借助箱型图或meanplot呈现处理间的差异。
最低0.47元/天 解锁文章
8099





