生存分析survival_analysis_COXmodel_python实现

沉住气CD

已于 2023-12-28 22:04:12 修改

阅读量1k

点赞数 16

CC 4.0 BY-SA版权

分类专栏：机器学习常用算法文章标签： python 算法机器学习人工智能数据挖掘

于 2023-12-28 20:24:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/PyDarren/article/details/135277662

什么是生存分析？

生存分析（在工程中也称为可靠性分析）的目标是建立协变量与事件发生时间之间的联系。该算法起源于临床医学研究，往往主要目标是预测死亡时间，即生存。生存分析是一种回归问题（人们想要预测一个连续的值），它与传统回归的不同之处在于，部分训练数据只能被部分观察到（它们被删减了）。

例如：
考虑一项临床研究，该研究调查了冠心病，时间跨度为1年。如图所示。
在这里插入图片描述

患者A在3个月后失去随访，无心血管事件记录，患者B在入组4个半月后发生事件，患者D在入组2个月后退出研究，患者E在研究结束前未发生任何事件。因此，只能记录患者B和C的心血管事件的确切时间，他们的记录是未删失的。对于剩余的患者，不知道他们是否在研究结束后是否发生了事件，因此他们的信息是删失的。

形式上，每个患者记录由一组协变量组成 $\in \mathbb{R}^d$ ，以及时间 $t > 0$ 事件发生的时间或时间 $c > 0$ 删失。由于删失、经历和事件是相互排斥的，所以通常定义一个事件指示器 $0;1}\delta \in \{0;1\}$ 以及可观察到的生存时间 $y > 0$ 。右删失样本可观测时间 $y$ 的定义为
$δ=0y=min(t,c)=\begin{cases} t& \text{ if } \delta =1 \\ c& \text{ if } \delta =0 \end{cases}$

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄7年

110
原创

700
点赞

1320
收藏

547
粉丝

关注

私信

分类专栏

工程开发 2篇
数据可视化 5篇
PyTorch 5篇
机器学习常用算法 11篇
NLP 3篇
统计学 12篇
python学习 17篇
R学习 11篇
数据库 7篇
爬虫 3篇
数据结构 19篇
深度学习 5篇

展开全部收起

上一篇：: 统计学-参数估计

下一篇：: Bagging算法_随机森林Random_Forest

最新评论

统计学之基础知识（数据分析准备）
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
利用R语言进行基本数据管理
沉住气CD: 强推ggplot2
R语言高级数据管理
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)使用更多的站内链接。
利用R语言进行基本数据管理
优快云-Ada助手: R语言中的数据可视化库有哪些？
利用R语言的dplyr包进行数据转换
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。