数据的线性模型分析与多重比较方法
1. 线性模型中的参数关系
在回归模型中,我们有 $y_{2j} = \beta_0 + \beta_1 + \epsilon_{2j}$。为使模型等价,可得 $\mu_2 = \beta_0 + \beta_1$,又因为 $\beta_0 = \mu_1$,所以 $\beta_1 = \mu_1 - \mu_2$。这表明 $\beta_1$ 量化了因子第一水平和第二水平之间的差异。同理,当 $i = 3$ 时,$\beta_2 = \mu_1 - \mu_3$。一般情况下:
- $\beta_0 = \mu_1$,即截距 $\beta_0$ 等于因子基础(或第一)水平的均值。
- $\beta_i = \mu_1 - \mu_i$,其中 $i = 2, \cdots, (k - 1)$。
不过,回归模型仅展示了每个组与第一组均值之间的差异,无法直接体现其他组间的差异。这带来两个结果:一是不能仅通过回归系数的 P 值就判定组间无差异;二是若要考察所有组对之间的差异,需额外做些工作。我们可借助方差分析(ANOVA)表来解决第一个问题,下面通过一个例子详细说明。
2. 示例:同一窗户中 RI 的差异均值检验
选取了 Bennett 数据中的三个面板,每个面板有 10 个 RI 测量值,目的是检验这三个位置的真实平均 RI 是否相同,即:
- 原假设 $H_0: \mu_1 = \mu_2 = \mu_3$。
- 备择假设 $H_1: \mu_i \neq \mu_j$,其中 $i \neq j$。
需要注意的是,备择假设表示“存在某些”而非“所有”组不同,意味着不必所
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



