以下是Duke Coursera Inferential Statistics的笔记:
:所有组的mean是一样的
;
:至少一组means是不同的
,不同组之间的可变性 / 单个组内的可变性
- Anova的使用条件:
- 独立
- 组内
- 随机采样/随机分布
- 小于所代表的总体的10%
- 组外
- 组内
- 接近正态分布:组内
- 相同的方差:每个组要有差不多的可变性
- 独立
- Anova具体
- p值是指如果所有组的平均值实际上相等,则“组间”和“组内”可变性之间的比率至少像F值一样大的概率;也是F分布在dfG和dfE之下的面积(表格下方图,来源于Facts about the F Distribution | Introduction to Statistics (lumenlearning.com))
| Df | Sum sq | Mean Sq | F value | Pr(>F) | |
| Group | k-1 | SSG | MSG | F=MSG/MSE | p |
| Error | n-k | SSE | MSE | ||
| Total | n-1 | SST |

- 如果p值很小(小于
),则否决
- 如果p值很大,我们不能否决
文章探讨了ANOVA在比较多个组均值时的使用条件,包括独立性、随机采样、正态分布和方差齐性。ANOVA通过比较组间和组内的可变性来测试均值差异,p值用于判断这些差异是否显著。若p值小,则拒绝零假设,即至少有一组均值不同;反之,若p值大,无法拒绝零假设。
1541





