R数据分析:生存分析与有竞争事件的生存分析的做法和解释

今天被粉丝发的文章给难住了,又偷偷去学习了一下竞争风险模型,想起之前写的关于竞争风险模型的做法,真的都是皮毛哟,大家见笑了。想着就顺便把所有的生存分析的知识和R语言的做法和论文报告方法都给大家梳理一遍。

什么时候用生存分析

当你关心结局和结局发生时间的时候,就要考虑生存分析了,这种既有结局又有时间的数据叫做生存数据,英文叫做Time-to-event data. 只不过因为这个方法医学上用来分析存活情况用的多,所以得名生存分析,反正你就记住一个例子,我要研究汽车发生故障,我也应该用生存分析,因为我既关心是不是有故障,我还关心用了多久(跑了多远)才出故障,就是既有time,又有event,Time-to-event data就用生存分析

基本概念

首先是删失,对象失访了,脱落了,出现结局之前随访结束了,都叫做删失:

R数据分析:生存分析与有竞争事件的生存分析的做法和解释

删失又分为左删失,区间删失和右删失,图示如下:

R数据分析:生存分析与有竞争事件的生存分析的做法和解释

比如我想研究得了A病的人的生存情况,存在的所有可能情形为:

第一种,研究的开始的时候有人已经有A病,这个时候人家已经活了一段时间了,具体多久我不知道,叫做左删失;

第二种,入组随访的时候没病,中途得了A病死了,什么时候得的,没记录下来,叫区间删失;

第三种,得了A病,一直活到了研究结束还没死,叫做右删失。

你看,所有的删失情况造成的后果都是我们没法准确估计发生结局的时间,这也是其名字删失的由来,对于这类数据就需记录为删失数据。

生存分析的种类有哪些

具体的种类是为了回答具体的问题,我们做生存分析常常要回答的问题如下:

R数据分析:生存分析与有竞争事件的生存分析的做法和解释

一个是描述生存情况,一个是比较,再一个就是探究影响因素。

比如我随访了很多病人,我就想知道随着时间变化这群人的生存概率是如何变化的(描述)?我就可以用简单粗暴的Kaplan-Meier method,又叫乘积极限法,基本思想就是此刻的生存概率等于上一时刻的生存概率乘以此刻的存活率。

比如我手上有如下数据:

R数据分析:生存分析与有竞争事件的生存分析的做法和解释

time是随访时间,status是结局,我就可以写出如下代码拟合出总体人群的生存曲线:

fit1 <- survfit(Surv(time,
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

公众号Codewar原创作者

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值