#分布图,连续变量的分布图
#导入包
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
#matplottib inline
plt.rcParams['font.sans-serif']=['Simhei']#显示中文
plt.rcParams['axes.unicode_minus']=False #显示负号
#认识函数
plt.hist?
#导入绘图的数据集
df=pd.read_csv('mpg_ggplot2.csv')
df.head()
#数据进行处理
df_agg=df.loc[:,['displ','class']].groupby('class')
df_agg.head()
#提取出每一列车型的发动机排量
vals=[df0['displ'].values.tolist() for i ,df0 in df_agg]
vals
#绘制直方图
plt.hist(vals,30,stacked=True)
plt.figure(figsize=(16,8),dpi=60) #创建画布
n,bins,patches = plt.hist(vals,30,stacked=