关联分析U聚类分析探讨心脏病的诱发

通过关联分析和聚类分析研究心脏病的诱发因素,发现经常喝酒抽烟的男性、高血压高血脂的抽烟者以及有不良生活习惯的人群患冠心病风险较高。K-Meas聚类显示,不健康的生活习性和心脏指标异常是患心脏病的主要原因,强调了预防心脏病的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 数据准备

现有一份heart disease.xls数据,内含21个变量,分别是ID(序号)、sex(性别)、age(年龄)、profession(工作强度)、Marital Status(婚姻状况)、owncar(私家车)、emotion(情绪)、tiredness(疲劳度)、exercise(运动量)、diet(饮食习惯)、sitting-up(熬夜)、petting(是否养宠物)、drink(喝酒)、smoking(吸烟)、familiar medical history(家族病史)、fatness(肥胖程度)、hypertension(血压)、blood sugar(血糖)、blood fat(血脂)、diabetes(糖尿病)、coronary heart disease(冠心病) 

2 变量分析

性别、年龄、工作强度等19个变量或直接或间接对冠心病的诱发产生影响,例如随着年龄的增大,人体器官随之衰老,身体状况下降也会加速心脏病的发作;工作强度高,精神压力大,休息不好明显增加心脏病的风险;精神压力大,情绪不好,抑郁焦虑等不安因素对人的心血管产生极大的影响,从而增大心脏病的风险;每天适当的运动量有助于增强血液循环,增强抵抗力,提高全身各脏器机能,远离疾病,减少患心脏病的风险;饮食与身体健康息息相关,长期高脂肪高热能饮食容易引发各类疾病,直接引发冠心病等。

3 任务要求

任务一:关联分析

对heartdisease.xls进行关联规则分析引发冠心病的关联因素。

任务二:聚类分析

对heartdisease.xls进行聚类分析,选择合适的聚类数,并选择一两个簇对其特征进行解释。

 

4 完成任务

4.1关联分析

对于任务一,我们选择关联模型下的Apriori算法,其中“冠心病”变量作为后项,19个影响因素变量作为前项,设置前项支持度阈值为

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值