泊松回归与有序回归:医学研究中的统计利器
在医学研究领域,统计方法的运用至关重要。泊松回归和有序回归是两种非常实用的回归模型,它们分别适用于不同类型的数据和研究问题。下面将详细介绍这两种回归模型。
泊松回归
泊松回归是逻辑回归的扩展,适用于事件发生风险较小,但个体数量众多,使得群体中事件发生数量较为可观的情况。在这种回归中,我们不仅需要知道个体是否发生了事件,还需要了解其随访时间,即人年数,这有时也被称为处于风险中的时间。泊松回归在流行病学中应用广泛,特别是在队列研究的分析中。
泊松模型
泊松模型的结果是一个群体在一段时间内事件发生的计数,例如暴露于石棉的群体在20年内的死亡人数。它是一种离散的定量变量。主要协变量是群体参与研究的时间度量。由于受试者参与研究的时间可能不同(即风险期),我们记录每个个体的观察时间,得到暴露时间 $e_i$。
在逻辑回归中,我们对事件发生的概率 $\pi_i$ 进行建模。而在泊松回归中,我们对潜在速率 $\lambda_i$ 进行建模,它是在时间段 $i$ 内预期发生的事件数量 $E_i$ 除以时间 $e_i$。我们使用简单的对数变换,而不是逻辑变换。
模型如下:
$$\log(\lambda_i) =\log\left(\frac{E_i}{e_i}\right)=\beta_0 + \beta_1X_{i1} + \cdots + \beta_pX_{ip}$$
也可以改写为:
$$E_i = e_i\exp\left[\log(e_i) + \beta_0 + \beta_1X_{i1} + \cdots + \beta_pX_{ip}\right]$