人工智能在疾病预测中的应用与方法
1. 建模概述
建模是创建改进分级方案的最后计算步骤,它结合图像衍生特征和临床衍生特征的输出,以预测已知临床结果的一组患者的生存概率或疾病显著进展的预期时间。标准临床特征包括年龄、种族、性别、病理阶段、实验室值、放射学特征和基因检测结果等。机器学习算法学习最相关的特征组合(包括影像和临床衍生特征),并量化每个特征在模型中的相对重要性,然后将该模型应用于训练和测试环境之外的新患者。
生存分析开发队列通常分为用于训练模型的集合和用于测试或验证模型的单独集合。创建这两组时需要考虑许多特定于疾病和队列的因素,但总体而言,它们在疾病类型、亚型、等级和结果方面应非常相似,以创建一个平衡的测试环境。
2. 生存分析相关概念
2.1 生存函数与 Kaplan - Meier 曲线
生存分析涉及分析和预测医疗事件(如死亡、疾病复发或疾病进展)发生时间的方法。生存函数用 (S(t)) 表示,即患者在时间 (t) 未经历事件并存活超过该时间的概率。随着时间推移,生存概率降低,如 Kaplan - Meier 曲线所示。
2.2 一致性指数(C - Index)
C - Index 是一种广泛使用的算法性能度量,是模型预测与实际生存时间之间的等级相关性形式,考虑了缺失或截尾数据。它具有一些优良特性:是模型正确预测随机一对患者中哪一个有更长生存时间的概率,在二元结果情况下,它是 ROC 曲线下的面积。C - Index 范围在 0 - 1 之间,值为 0.5 意味着模型结果不比随机猜测好。需要注意的是,C - Index 表示算法的判别能力,但不表示预测能力,因为它只关注正确排序对
超级会员免费看
订阅专栏 解锁全文
517

被折叠的 条评论
为什么被折叠?



