医疗数据的患者特异性建模与高维生存分析中的贝叶斯稀疏Cox回归
患者特异性医疗数据建模
在医疗数据建模中,有两种使用AUC(Area Under the Curve,曲线下面积)指标选择患者特征的方法。
一种方法是使用Matlab中的 trapz 函数,以基于坐标矩阵计算的假阳性率和真阳性率为参数进行计算,计算结果存储在 v AUC 向量中。对其他属性重复这些步骤,最后选择AUC值最佳的属性。当满足某个停止条件时,路径完成并给出预测标签。
另一种替代方法,由Fawcett提出,需要对类别概率或其他分数进行预测。采用留一法交叉验证方案生成概率估计,并进一步计算Mann - Whitney - Wilcoxon检验统计量,该统计量与AUC直接相关。为避免过拟合,在估计类别概率时采用Laplace平滑。
PSDP - STD - AUC和PSDP - AUC - Split算法在计算AUC之前的步骤有所不同。PSDP - STD - AUC算法会对数据集中的所有情况进行操作概率估计,这些估计根据与测试实例值相同的训练实例子集和值不同的训练实例子集来计算。在根据Laplace平滑进行这些估计计算后,使用Matlab中的 colAUC 函数,以训练集的所有概率、真实类别以及每个实例的标签为参数计算AUC。后续步骤与PSDP - AUC - Split算法相同。
实验结果
-
数据集 :用于测试算法的所有数据集均来自UCI仓库,用于分类任务。连续变量使用Fayyad和Irani开发的基
超级会员免费看
订阅专栏 解锁全文
952

被折叠的 条评论
为什么被折叠?



