目录
3.1.1 补充知识点1:fig.add_subplot()
4.1primitives 和 container的区别和联系是什么,分别用于控制可视化图表中的哪些要素
4.2使用提供的drug数据集,对第一列yyyy和第二列state分组求和,折线图
一、概述
先导入所需要的库和方法
import numpy as np
import pandas as pd
import re
import matplotlib
import matplotlib.pyplot as plt
from matplotlib.lines import Line2D
from matplotlib.patches import Circle, Wedge
from matplotlib.collections import PatchCollection
1.1matplotlib的三层api
matplotlib的原理或者说基础逻辑是,用Artist对象在画布(canvas)上绘制(Render)图形。
就和人作画的步骤类似:
- 准备一块画布或画纸
- 准备好颜料、画笔等制图工具
- 作画
所以matplotlib有三个层次的API:
matplotlib.backend_bases.FigureCanvas
代表了绘图区,所有的图像都是在绘图区完成的matplotlib.backend_bases.Renderer
代表了渲染器,可以近似理解为画笔,控制如何在 FigureCanvas 上画图。matplotlib.artist.Artist
代表了具体的图表组件,即调用了Renderer的接口在Canvas上作图。
前两者处理程序和计算机的底层交互的事项,第三项Artist就是具体的调用接口来做出我们想要的图,比如图形、文本、线条的设定。所以通常来说,我们95%的时间,都是用来和matplotlib.artist.Artist类打交道的。
(这里我也不太懂什么意思,写的很抽象)
1.2Artist
因为我们大多是和Artist和打交道,所以在这里介绍Artist。
Artist有两种类型:primitives
和containers
。
primitive
是基本要素,它包含一些我们要在绘图区作图用到的标准图形对象,如曲线Line2D,文字text,矩形Rectangle,图像image等。container
是容器,即用来装基本要素的地方,包括图形figure、坐标系Axes和坐标轴Axis。
他们之间的关系如下图所示:
可视化中常见的artist类可以参考下图这张表格,解释下每一列的含义。
第一列表示matplotlib中子图上的辅助方法,可以理解为可视化中不同种类的图表类型,如柱状图,折线图,直方图等,这些图表都可以用这些辅助方法直接画出来,属于更高层级的抽象。
第二列表示不同图表背后的artist类,比如折线图方法plot
在底层用到的就是Line2D
这一artist类。
第三列是第二列的列表容器,例如所有在子图中创建的Line2D
对象都会被自动收集到ax.lines
返回的列表中。
下一节的具体案例更清楚地阐释了这三者的关系,其实在很多时候,我们只用记住第一列的辅助方法进行绘图即可,而无需关注具体底层使用了哪些类,但是了解底层类有助于我们绘制一些复杂的图表,因此也很有必要了解。
Axes helper method | Artist | Container |
bar - bar charts |
Rectangle |
ax.patches |
errorbar - error bar plots |
Line2D and Rectangle |
ax.lines and ax.patches |
fill - shared area |
Polygon |
ax.patches |
hist - histograms |
Rectangle |
ax.patches |
imshow - image data |
AxesImage |
ax.images |
plot - xy plots |
Line2D |
ax.lines |
scatter - scatter charts |
PolyCollection |
ax.collections |
-
Axes helper methord 表示matplotlib中子图上的辅助方法,可以理解为可视化中不同种类的图表类型,如柱状图,折线图,直方图等,这些图表都可以用这些辅助方法直接画出来,属于更高层级的抽象。
-
Artist 表示不同图表背后的artist类,比如折线图方法
plot
在底层用到的就是Line2D
这一artist类。 -
Container 是第二列的列表容器,例如所有在子图中创建的
Line2D
对象都会被自动收集到ax.lines
返回的列表中。
二、基本元素 - primitives
primitives
的几种常见类型:曲线-Line2D,矩形-Rectangle,多边形-Polygon,图像-image
2.1曲线-Line2D
在matplotlib中曲线的绘制,主要是通过类 matplotlib.lines.Line2D
来完成的。
matplotlib中线-line
的含义:它表示的可以是连接所有顶点的实线样式,也可以是每个顶点的标记。此外,这条线也会受到绘画风格的影响,比如,我们可以创建虚线种类的线。
它的构造函数:
class matplotlib.lines.Line2D(
xdata, ydata, linewidth=None, linestyle=None, color=None, marker=None,
markersize=None, markeredgewidth=None, markeredgecolor=None,
markerfacecolor=None, markerfacecoloralt='none', fillstyle=None,
antialiased=None, dash_capstyle=None, solid_capstyle=None,
dash_joinstyle=None, solid_joinstyle=None, pickradius=5,
drawstyle=None, markevery=None, **kwargs)
其中常用的的参数有:
- xdata:需要绘制的line中点的在x轴上的取值,若忽略,则默认为range(1,len(ydata)+1)
- ydata:需要绘制的line中点的在y轴上的取值
- linewidth:线条的宽度
- linestyle:线型
- color:线条的颜色
- marker:点的标记,详细可参考markers API
- markersize:标记的size
其他详细参数可参考Line2D官方文档
2.1.1如何设置Line2D的属性
- 直接在plot()函数中设置
- 通过获得线对象,对线对象进行设置
- 获得线属性,使用setp()函数
# 1) 直接在plot()函数中设置
x = range(0,5)
y = [2,5,7,8,10]
plt.plot(x,y, linewidth=10); # 设置线的粗细参数为10
# 2) 通过获得线对象,对线对象进行设置
x = range(0,5)
y = [2,5,7,8,10]
line, = plt.plot(x, y, '-') # 这里等号坐标的line,是一个列表解包的操作,目的是获取plt.plot返回列表中的Line2D对象
line.set_antialiased(False); # 关闭抗锯齿功能
# 3) 获得线属性,使用setp()函数设置
x = range(0,5)
y = [2,5,7,8,10]
lines = plt.plot(x, y)
plt.setp(lines, color='r', linewidth=10);
2.1.2如何绘制Lines(例:绘制直线与误差线)
2.1.2.1绘制直线的方法
a)使用subplots绘制直线
x= range(0,5)
y=[5,4,3,2,1]
fig,axes = plt.subplots()
axes.plot(x,x)
axes.plot(x,y);
通过打印axes.lines,可以发现有两个对象
b)使用Line2D对象绘制
x = np.arange(0,5)
fig,ax = plt.subplots()
lines = [Line2D(x,x+1),Line2D(x,x+2,color='orange')]
for line in lines:
ax.add_line(line)
ax.set_xlim(0,5)
ax.set_ylim(0,8)
注意:x=range(0,5)不行,要转为list(range(0,5),所以直接使用np.arange()
2.1.2.2绘制误差线
pyplot里有个专门绘制误差线的功能,通过errorbar
类实现,它的构造函数:
matplotlib.pyplot.errorbar(x, y, yerr=None, xerr=None, fmt='',
ecolor=None, elinewidth=None, capsize=None, barsabove=False,
lolims=False, uplims=False, xlolims=False, xuplims=False,
errorevery=1, capthick=None, *, data=None, **kwargs)
其中最主要的参数是前几个:
- x:需要绘制的line中点的在x轴上的取值
- y:需要绘制的line中点的在y轴上的取值</