回归分析:从基础模型到有效推断
1. 经典多元回归模型
经典多元回归模型将结果变量 $Y$ 的期望值建模为协变量 $X_1,X_2, …, X_p$ 的函数,可表示为:
$\mu(x_1,x_2, …, x_p) = \beta_0 +\beta_1x_1 +\beta_2x_2 + … +\beta_px_p$
回归系数 $\beta_j$ 有清晰且独特的解释:若两个对象除协变量 $X_j$ 有差异 $\Delta$ 外,其他协变量值相同,那么这两个对象 $Y$ 的期望值差异为 $\Delta × \beta_j$。特别地,若 $X_j$ 相差 1,$Y$ 的期望值相差 $\beta_j$,这对二元变量 $X_j$ 同样适用。
获取回归参数估计的一般原则是最小二乘法,即最小化残差平方和:
$r_i = y_i -\mu(x_{i1},x_{i2},…,x_{ip}) = y_i -\beta_0 -\beta_1x_{i1} -\beta_2x_{i2} -… -\beta_px_{ip}$
统计软件包会为我们完成最小化任务,并提供置信区间和 p 值。
2. 调整效应
2.1 调整混杂因素
以研究吸烟是否会升高血压为例。收集 302 名受试者过去 12 个月的吸烟量和当前收缩压数据,简单线性回归结果显示:
| variable | beta | SE | 95%CI | p-value | </
|---|
超级会员免费看
订阅专栏 解锁全文
1566

被折叠的 条评论
为什么被折叠?



