临床研究中的生存分析与数据处理
1. 生存分析基础
生存分析是临床研究中至关重要的一部分,主要用于评估生存时间与解释变量之间的关系。这通常包括考虑可用变量的潜在混杂效应来绘制生存曲线,或者进行第二步的统计建模。其中,Cox比例风险模型是这一步骤中最常用的模型。
1.1 Kaplan - Meier生存曲线与对数秩检验
描述性统计虽然能提供生存时间的总体比较,但无法在不同随访时间点对两组或多组进行比较。因此,我们需要借助Kaplan - Meier(KM)方法来估计生存曲线$S(t)$,并使用对数秩检验或类似的假设检验来判断两条或多条生存曲线是否等价。同时,我们还可以计算KM曲线和中位生存时间的95%置信区间。
1.1.1 KM曲线的理论公式
使用KM方法估计事件发生时间$t(f)$的生存曲线$\hat{S}(t_f)$,其理论公式可以表示为:
$\hat{S}(t_f)=\hat{S}(t_{f - 1})\times\hat{Pr}(T > t_f|T\geq t_f)$
也可以写成所有估计事件发生时间及更早时间的条件概率分数的乘积:
$\hat{S}(t_f)=\prod_{i = 1}^{f}\hat{Pr}(T > t_f|T\geq t_f)$
1.1.2 KM曲线的实际构建
在实际操作中,为了方便构建KM曲线,收集的生存数据应整理成表格形式,每组或每种治疗至少包含三列:按从小到大排序的生存时间、每个不同失败时间的失败(事件)频数计数,以及在时间区间$[t(f), t(f + 1))$内被删失的受试者频数计数。
-
超级会员免费看
订阅专栏 解锁全文
2099

被折叠的 条评论
为什么被折叠?



