生存分析:原理、应用与实例解读
1. 生存分析基础
从输出结果可知,积极治疗相关的风险比为 0.759(95%置信区间 0.315 至 1.830)。通过似然比(LR)、Wald 和得分(对数秩)方法得出的相关 p 值均为 0.5,这表明治疗效果的证据不足。风险和置信区间与使用对数秩检验的结果非常相似。需要注意的是,z 统计量并非风险比与其标准误的比值,而是回归系数(风险比的对数)与其标准误的比值。
2. 模型解读
在模型 4.1 中,预测变量可以是连续的或离散的。若只有一个二元预测变量 X,其解读与对数秩检验密切相关。此时,若与 X 相关的系数为 b,则 exp(b) 是 X = 1 的个体相对于 X = 0 的个体的相对风险(通常称为相对危险度 RR)。当存在多个协变量时,解读与二元结果的情况非常相似。由于线性预测变量通过指数变换与结果相关,线性预测变量中的加法关系在结果中变为乘法关系,如同逻辑回归一样。
3. 模型的推广
- 分层模型
假设我们有两组,且不希望假设一组的发病率是另一组发病率的恒定倍数。例如,有严重疾病(SD)和轻度疾病(MD)。期望 SD 相对于 MD 的风险随时间保持恒定可能不太合理。此时,可以为两组分别拟合两个模型:- 对于 SD:
[
\log h_{iSD}(t) = \log h_{SD}(t) + \beta_1 X_{i1} + \cdots + \beta_p X_{ip}
] - 对于 MD:
[
\log h_{iMD}(t) =
- 对于 SD: