数据挖掘在医学研究中的应用:关联规则分析与多维标度法
1. 关联规则分析
1.1 核心指标含义
- 提升度(Lift) :用于比较同时患有超重和冠心病(CAD)的患者的实际比例与假设 CAD 和超重相互独立时的预期比例。若实际值大于预期值,如 1.25 对比 1.00,则表明超重会增加患 CAD 的风险。
- 确信度(Conviction) :对比总体中未患 CAD 的患者与既未患 CAD 又超重的患者的情况。当该比值大于 1.00(如 1.20)时,说明总体中未患 CAD 的益处优于超重亚组。
为评估计算值(如 0.2 和 1.25)与 0.0 到 1.0 的显著差异,需计算置信区间,可使用 McCallum - Layton 比例计算器。不过,该计算会略微高估真实的置信区间,导致 p 值偏大,但如果结果显著则无需担忧。
1.2 实例分析
1.2.1 单预测因子实例
| 患者编号 | 超重情况 | 是否患 CAD |
|---|---|---|
| 1 | 1.00 | 0.00 |
| 2 | 0.00 | 1.00 |
| … |
数据挖掘在医学中的应用
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



