Python打卡训练营学习记录Day7

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data =pd.read_csv("heart.csv")
print(data.info())
print(data.head(10))
# age:年龄
# sex:性别
# cp:胸痛类型
# trestbps:静息血压
# chol:胆固醇
# fbs:空腹血糖
# restecg:静息心电图
# thalach:最大心率
# exang:运动诱发心绞痛
# oldpeak:旧峰值(医学上常指运动后 ST 段压低)
# slope:斜率
# ca:冠状动脉(钙化情况)
# thal:地中海贫血(或心肌灌注等医学相关指标)
# target:目标
# 设置全局字体为支持中文的字体 (例如 SimHei)
plt.rcParams['font.sans-serif'] = ['SimHei']
# 解决负号'-'显示为方块的问题
plt.rcParams['axes.unicode_minus'] = False
#用柱状图查看样本的分布
sns.countplot(x='target',data=data)
plt.title('样本健康和患者的分布')
plt.xticks([0, 1], ['健康', '患者'])
plt.show()
#用直方图查看年龄的分布
sns.histplot(x='age',data=data,kde=True)
plt.title('年龄的分布')
plt.show()
#绘制年龄在健康和患者之间的关系图
plt.figure(figsize=(8, 6))
sns.histplot(x='age', data=data[data['target'] == 0], kde=True, color='blue', label='健康')
sns.histplot(x='age', data=data[data['target'] == 1], kde=True, color='red', label='患者')
plt.title('年龄在健康和患者之间的关系图')
plt.legend()
plt.show()
#查看样本中性别的分布
sns.countplot(x='sex',data=data)
plt.title('样本中性别分布')
plt.xticks([0, 1], ['女性', '男性'])
plt.show()
#由于样本中男性样本明显多于女性样本,我们可以查看男性和女性在健康和患者之间的关系
sns.countplot(x = 'target', data = data, hue = 'sex')         
plt.xticks([0, 1], ['健康', '患者'])
plt.legend(labels=['女性', '男性'], title='性别')   
plt.show()              
#用箱线图查看静息血压和样本之间的关系
sns.boxplot(x='target', y='trestbps', data=data)
plt.title('静息血压和样本之间的关系')
plt.xticks([0, 1], ['健康', '患者'])
plt.show()

@浙大疏锦行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值