基于排列特征重要性的心血管疾病预测模型研究
1. 数据预处理
数据预处理是将原始数据转换为机器学习模型可用格式的步骤,它能提高深度学习模型的准确性和效率。具体操作如下:
- 检查缺失值 :对从数据集中选取的十二个特征进行检查,未发现缺失值。
- 特征缩放 :在特征缩放方面,选择标准化而非归一化。标准化是一种将数据重新缩放的方法,使列的值转换为均值为 0、方差为 1 的正态分布形式。
以下是数据集中心脏病相关属性的描述表格:
| 属性 | 给定代码 | 单位 | 数据类型 |
| — | — | — | — |
| 年龄 | Age | 年 | 数值型 |
| 性别 | Sex | 1, 0 | 二进制型 |
| 胸痛类型 | Chest pain type | 1, 2, 3, 4 | 标称型 |
| 静息血压 | Resting bp s | mmHg | 数值型 |
| 血清胆固醇 | Cholesterol | mg/dl | 数值型 |
| 空腹血糖 | Fasting blood sugar | 1, 0 >120mg/dl | 二进制型 |
| 静息心电图结果 | Resting ecg | 0, 1, 2 | 标称型 |
| 最大心率 | Max heart rate | 71 - 202 | 数值型 |
| 运动诱发心绞痛 | Angina | 0, 1 | 二进制型 |
| Oldpeak=ST | Oldpeak | 抑郁 | 数值型 |
| 峰值运动
超级会员免费看
订阅专栏 解锁全文
58

被折叠的 条评论
为什么被折叠?



