慢性肾病预测与社交媒体文本命名实体提取研究
慢性肾病基于性能的预测
实验设计
实验在 Orange 3.14.0 数据挖掘平台上,借助图 1 和图 4 中的可视化程序开展。研究涵盖两个实验以及预处理分析。预处理时,对存在缺失值的案例进行成对删除,同时基于目标变量进行分组特征刻画,此刻画着重于慢性肾病(CKD)病史,而非依据性别进行分类。
- 第一个实验按图 1 设定,执行可视化程序并获取性能指标。
- 第二个实验基于最佳表现模型预测 CKD,其可视化程序如图 4 所示,目的是构建用于早期 CKD 检测的框架。
预处理与基础统计
在处理数据时,未采用基于患者性别的特征刻画方式,而是聚焦于目标人群中 CKD 的发生情况。研究选用 470 个案例,排除了 21 个信息缺失的案例。目标变量 EventCKD35 有 0 和 1 两个水平,分别代表 CKD 晚期和早期。经分析,88.5%的样本患者处于晚期,仅 11.5%处于早期。
|属性|EventCKD35 = 0(晚期)|EventCKD = 1(早期)|总体|
| ---- | ---- | ---- | ---- |
|eGFR 基线|100.01 (17.68)|79.13 (12.39)|97.61 (18.39)|
|肌酐基线|82.85 (17.26)|55.89 (16.96)|67.84 (17.82)|
|胆固醇基线|5.04 (1.09)|4.54 (1.11)|4.98 (1.10)|
|年龄基线|62.70 (9.21)|52.59 (13.68)|53.75 (13.62)|
|舒张压基线|7
超级会员免费看
订阅专栏 解锁全文
932

被折叠的 条评论
为什么被折叠?



