可解释人工神经网络与肿瘤生存预测的探索
1. 研究背景与目标
在医学研究中,生存分析聚焦于研究直至发生感兴趣事件(如患者死亡或康复)所经过的时间。在静脉血栓栓塞(VTE)复发风险预测以及肿瘤患者生存预测方面,传统方法存在一定局限性,而人工神经网络(ANN)在处理复杂数据和非线性关系上展现出潜力。本文一方面通过对蛋白质组和临床数据集应用基于ANN的策略,识别与VTE复发风险相关的新型分子标记物;另一方面探索神经网络在基于临床和RNA - seq数据的生存分析中的潜力,比较不同神经网络方法在高维输入下的性能。
2. VTE复发风险预测研究
2.1 研究设计与方法
- 数据与样本 :研究基于913名患者的样本,对383个临床和蛋白质组标记物进行了分析,是目前基于ANN的VTE复发研究中患者数量和评估特征数量最多的研究之一。
- 方法步骤 :采用两步法,首先实施欠采样算法,解决原始数据集在有复发和无复发患者数量上的不平衡问题以及数据的异质性;然后构建一个3层的ANN。
graph LR
A[原始数据集] --> B[欠采样算法]
B --> C[3层ANN]
C --> D[复发预测模型]
2.2 预测模型性能
所得到的复发预测模型具有良好的区分能力,AUC为0.91 [0.82 - 0.97],优于应用于相同数据的标准随机森林算法。
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



