用 R 进行高级统计分析
1. 高级统计分析入门
之前我们介绍了四种不同例子的统计和 R 输出解释,包括卡方列联表分析、t 检验、简单线性回归和单因素方差分析。现在,我们将扩展模型的复杂性,引入包含多个解释变量的分析,重点关注具有两个解释变量的模型,即双因素方差分析(two-way ANOVA)和协方差分析(ANCOVA)。我们的重点仍然是如何在 R 中实现这些分析,而不是统计方法的细节。如果对这些工具的统计基础不熟悉,建议花时间学习。工作流程仍然是“绘图 -> 建模 -> 检查假设 -> 解释结果 -> 再次绘图”,不过 dplyr 和 ggplot2 的优势可能会更加明显。
2. 双因素方差分析
单因素方差分析的解释变量是分类变量,例如寄生虫变量有四个水平。双因素方差分析是单因素方差分析的逻辑扩展,涉及包含两个解释变量的实验或结构化数据收集,这两个解释变量也都是分类变量。双因素方差分析对应具有二维结构的数据,响应变量可能随两个变量而变化。设计与双因素方差分析相关的实验和数据收集的一个重要原因是,响应变量随一个变量的变化方式可能依赖于另一个变量,这就是统计交互作用。交互作用的概念通常是涉及多个解释变量的假设的核心。
2.1 奶牛生长数据
我们以奶牛生长数据为例,来阐述双因素方差分析相关假设的性质。奶牛被喂食三种饲料之一:大麦、燕麦和小麦;饲料还添加了四种补充剂之一(包括对照组和其他有趣名称的补充剂)。数据采用完全析因实验设计,每种饲料和补充剂的组合重复三次,即有 3 种饲料 × 4 种补充剂 = 12 种处理组合,每种组合有 3 头奶牛。
数据文件名为 growth.csv,可从 htt
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



