基于医疗数据集关联分类和遗传算法的心血管疾病早期预测
1. 引言
数据挖掘技术能将原始数据转化为有用信息,许多公司会利用它来分析大量数据,从而更好地了解客户,制定有效的营销策略,还能增加收入、降低成本和提高生产力。数据挖掘作用于被称为数据仓库的大型数据存储库,它由关联、分类、聚类、预测和组合等多种工具和技术组成,也可将两种或多种数据挖掘技术结合以获得高精度结果。
关联和分类技术是密切相关的数据挖掘方法,将它们结合形成的关联分类,可构建预测模型分类器,这种方法能更好地用于人类疾病预测。因此,提出了基于关联类型,利用遗传算法从医疗数据集中发现知识的方法。
2. 相关工作
自关联分类被提出以来,受到了研究人员和数据挖掘从业者的广泛关注。以下是关联分类在医疗数据集上的一些应用:
- 针对不平衡数据分类问题,有采用动态粒子群和蚁群优化器的方法来处理。
- 提出了基于关联规则的多类分类方法,该方法能有效发现频繁项并对其进行排序,以便选择高置信度规则作为分类器的一部分。
- 有利用分类技术改进的心脏病预测系统,使用13种不同属性从医疗数据集中提取知识。
- 提出了使用数据挖掘方法预测院外心脏骤停后生存原因的模型,结合经典统计分析和贝叶斯网络中的数据挖掘,帮助医生预测患者的生存情况。
- 提出了一种诊断心血管疾病的方法,利用分类方法从HRV和ECG图像中提取与心脏病相关的多个参数。
3. 背景知识
3.1 关联分类
关联分类利用关联规则挖掘生成分类规则,它是关联规则挖掘和多样性的结合,形成右侧为结果的特殊关联规则子集。关联分类过程的输出以简单的if - t
超级会员免费看
订阅专栏 解锁全文
772

被折叠的 条评论
为什么被折叠?



