数据可视化库——Matplotlib
import matplotlib.pyplot as plt
- 默认可视化操作
- plt.plot():画图
- plt.show():显示
- 设置参数
- plt.xticks(rotation):变量名倾斜
- plt.xlable(‘变量名’):x轴名称
- plt.ylabel(‘变量名’):y轴名称
- plt.title():标题名称
- 子图
- fig=plt.figure():指定默认画图空间
- fig.add_subplot(4,1,x):x代表相对位置
- 加注释:plt.legend(loc=‘best’) 'best’代表注释框的位置
- 绘图种类:fig,ax=plt.subplots(),ax是画图的轴,实际画图;fig用来设置参数
- 柱形图:
- ax.bar(bar_positions, bar_heights, 0.5),0.5代表柱宽
- ax.barh():橫柱形图
- 散点图:ax.scatter(x, y)
- 直方图(有bins):
- ax.hist(y, range(4,5), bins=20),range设置了值的范围
- ax.set_ylim(0.5):设置y轴范围
- 盒图:ax.boxplot()
- 在某元素上加文字:ax.text(x, y, ‘text’)
可视化库——Seaborn
import seaborn as sns
- Seaborn库是在Matplotlib库基础上的封装
- 设置风格
- sns.set():默认风格
- sns.set_style(“风格”):5种风格
- with sns.axes_style(“风格”):with下的语句全部使用这种风格
- 布局
- sns.despline(offset, left):设置轴线的偏置及显示
- sns.set_context(“paper”):设置图中曲线大小
- 调色板:sns.color_palette(),共有6个主题
- 圆形画板:sns.color_palette(“hls”)
- 成对:“Paired”
- 连续型
- sns.color_palette(“Blues”):由浅到深
- sns.color_palette(“Blues_r”):由深到浅
- sns.light_palette(“green”):由浅到深,reverse=True表示由深到浅
- sns.dark_palette(“green”):由深到浅
- 线型:sns.cubehelix_palette(8, start, rot)
- 变量分析
- 单变量:sns.distplot(x, kde, bins, fit)——直方图
- x:变量
- kdn:估计和密度
- bins:将x轴分为几份
- fit:分布状态
- 双变量:
- sns.jointplot(x, y, data)——散点图
- sns.jointplot(x, y, kind=“hex”, color)——可体现数据密度
- 多变量
- sns.pairplot():体现两两变量之间的关系
- sns.stripplot(x, y, data):不推荐,数据量大时连成一条线
- 优化方法:
- sns.stripplot(x, y, data, jitter=True)——加小幅度的抖动
- sns.swamplot(x, y, data)——树状
- sns.violinplot(x, y, hue, data, split)——小提琴图
- 回归分析:regplot,lmplot
- sns.load_dataset(“数据”)——下载数据
- sns.regplot(x, y, data, jitter)
- 分类分析
- sns.barplot(x, y, hue, data):条形图,描绘整体趋势
- sns.pointplot(x, y, hue, data):点图,描绘变化差异
- sns.factorplot(x, y, data, kind):多层面板分类图
- Facetgrid——展示子集
- 使用方法
- g=sns.FacetGrid(data, col)
- g.map(plt.hist, “变量”)
- 设置参数
- g.set_axis_labels():轴的名称
- g.set(xticks, yticks):x,y的取值
- g.fig.subplots_adjust(wspace, hspace):间隙
- 多变量
- g.PairGrid()
- g.map_diag()
- g.map_offdiag()
- 热度图:sns.heatmap(data, vmin, vmax, center, annt,fmd, linewidth, cmap)
- annot:在每一格中显示数字
- fmd:显示数字的格式
- linewidth:格间距离
- cmap:颜色图