多时间跨度下前列腺癌生存预测的稳健机器学习协议
1. 引言
前列腺癌是全球男性中常见的癌症之一,在欧洲、北美和非洲部分地区,它更是男性群体中最为常见的癌症类型。这种癌症在前列腺腺体内发展,存在良性和恶性之分。癌细胞可能从前列腺肿瘤脱离,通过血管或淋巴结扩散到身体其他部位,进而附着在其他组织上形成新的肿瘤,对身体造成损害。其中,转移性去势抵抗性前列腺癌(mCRPC)即便在体内睾酮水平降至极低时,仍会持续发展。
对前列腺癌患者生存情况进行预测是该领域研究的重要目标。以往,Halabi及其同事提出了基于比例风险模型的经典预测方法,该模型依赖于乳酸脱氢酶、前列腺特异性抗原、碱性磷酸酶等八个临床变量。还有研究采用了主要基于PSA水平的联合纵向生存 - 治愈模型,以及利用DNA甲基化数据构建生存预测模型。
2015年,前列腺癌DREAM挑战赛举办,众多科学家参与其中,开发出了比参考模型性能更优的新算法。然而,这些模型大多属于比例风险模型的变体,其变量对不同预测时间跨度的影响相同,缺乏灵活性。同时,DREAM挑战赛的形式存在数据利用不充分和建模误差评估低效的问题。
为解决这些问题,本研究采用了一种稳健的建模协议,构建不同时间跨度的预测模型,不仅能获得与DREAM挑战赛综合模型相当的预测结果,还能详细分析不同因素在不同时间跨度下对患者生存的影响。
2. 材料与方法
2.1 数据
本研究使用了DREAM挑战赛公开的数据,这些数据来自VENICE、MAILSAIL和ENTHUSE三项临床试验,共包含1600个病例。数据涵盖了患者的病史、实验室值、病变部位、既往治疗、生命体征和基本人口统计信息等五类变量,以及两个前列腺癌进展的临床
超级会员免费看
订阅专栏 解锁全文

3775

被折叠的 条评论
为什么被折叠?



