生存分析
生存分析基础知识
生存分析
定义:将事件结局的出现与否和达到终点所经历的时间结合起来的 统计方法
背景:对于癌症患者,更加关注“生存时间”,比如常常听到的:5年存活率、3年存活率……,且某种治疗方法的价值主要表现在延长患者的存活时间。
比如在一项针对癌症患者的研究中,研究者更加关注的问题在观测时间点发生特定事件的概率,寻找个体协变量与个体生存状态之间的潜在关系(观测时间和观测事件状态)
- 癌症患者在接受治疗后的生存状况如何
- 哪种疗法的效果更好
- 这些患者在接受治疗后的生存状况与哪些因素有关
事件
生存时间
删失问题
生存数据
- 兼有时间和结局两种属性的数据,生存数据表示集合A={( x i x_i xi, T i T_i Ti, δ i \delta _i δi)|i=1,…,n}
n表示数据中观测个数的数目 x i x_i xi 是维度为m的向量,表示第i个个体的协变量 Ti表示该个体最后一次的观测时间(末次随访时间)
δ i \delta _i δi ∈ \in ∈{0,1}表示在Ti时刻是否观察到该个体有感兴趣的事件发生。
令Te表示感兴趣的事件的研究终点&#