目录
前言:
在心脏病患病率不断上升,我们运用JAVA所学知识,在Spark+Scala的技术上分析心脏病数据集而作为预防参考
一:数据来源与指标介绍
1.数据来源:
数据来源于医学分析网上采集的心脏病数据集,链接我会放在下面
2.指标介绍:
. -→age:-该朋友的年龄e
。-→年龄:-该朋友的年龄e →sex:-该朋友的性别-(1-=-男性,O-=-女性)火
→性别:-该朋友的性别-(1-=-男性,O-=-女性)火) cp:·经历过的胸痛类型(值1:典型心绞痛,值2:非典型性心绞痛,值3:非心绞痛,值0:无症状)
CP:·经历过的胸痛类型(值1:典型心绞痛,值2:非典型性心绞痛,值3:非心绞痛,值0:无症状) trestbps:-该朋友的静息血压(入院时的毫米汞柱)chal:·该朋友的胆固醇测量值,单位·: - mg/dlets人的空腹血糖(>-120-mg/dl,1=真;-0=假〉e
Trestbps:-该朋友的静息血压(入院时的毫米汞柱)chal:·该朋友的胆固醇测量值,单位·:-mg/dlet人的空腹血糖(>-120 mg/dl,1=真;-0=假>e restecg-静息心电图测量(0=正常,1=患有ST-T 波异常,2=根据Estes的标准显示可能或确定的左心室肥大〉e
RESTecg-静息心电图测量(0=正常,1