【数据分析11天打卡DAY4】第二章 数据可视化

本文通过使用Python的matplotlib库,对泰坦尼克号数据集进行多种方式的数据可视化,包括男女生存比例、不同票价和年龄的生存率等,展示了如何进行有效的数据探索。

1开始之前,导入numpy、pandas以及matplotlib包和数据

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv(‘result.csv’)
df.head(2)

《Python for Data Analysis》第九章

1.跟着书本第九章,了解matplotlib,自己创建一个数据项,对其进行基本可视化
2.可视化展示泰坦尼克号数据集中男女生存人数分布情况(用柱状图试试)

分组:用groupby
统计人数:用sum .count()
sex = df.groupby(‘Sex’)[‘Survived’].sum()
画柱状图直接用plot.bar()
sex.plot.bar()
加标题
plt.title(‘survived’)

3.可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图(用柱状图试试)
就是说生存与死亡这一列也要分组
sex_Survived = df.groupby(‘Sex’,‘Survived’)[‘Survived’].count()
转置.unstack()
died=sex_Survived[0] #调用第一列
died.plot.bar()
plt.title(‘died’)

上图结合

sex_Survived.plot.bar()
sex_Survived.plot(kind=‘bar’,stacked=‘True’)

4.可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图试试)(横轴是不同票价,纵轴是存活人数)
fare = df.groupby(‘Fare’,‘Survived’)[‘Survived’].count()
折线图
fare.plot()

5.可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况。(用柱状图试试)
pclass = df.groupby(‘Pclass’,‘Survived’)[‘Survived’].count().unstack()

pclass.plot.bar()

6.可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况。(不限表达方式)

年龄分五段,颜色透明度

df.Age[df.Survived0].hist(bins=5,alpha=0.5)
df.Age[df.Survived
1].hist(bins=5,alpha=0.5)
plt.legend((0,1))#标签
plt.xlabel(‘age’)
plt.ylabel(‘count’)

纵坐标改为密度
df.Age[df.Survived0].hist(bins=5,alpha=0.5,density=1)
df.Age[df.Survived
1].hist(bins=5,alpha=0.5,density=1)
加一条密度曲线
df.Age[df.Survived1].plot.density()
df.Age[df.Survived
0].plot.density()
plt.legend((0,1))#标签
plt.xlabel(‘age’)
plt.ylabel(‘density’)

7.可视化展示泰坦尼克号数据集中不同仓位等级的人年龄分布情况。(用折线图试试)

df.Age[df.Pclass==1].plot.density()

unique_pclass=df.Pclass.unique()
unique_pclass.sort()#排序
unique_pclass

for i in unique_pclass:
df.Age[df.Pclass==i].plot.density()
plt.legend(unique_pclass)#标签
plt.xlabel(‘age’)
plt.ylabel(‘density’)

另外一个包的操作
在这里插入图片描述在这里插入图片描述

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值