目录
第五章 数据可视化
5.1 二维绘图
5.1.1 一维数据集
生成20个标准正态分布(伪)随机数,保存在Numpy ndarray中。
'''
生成20个标准正态分布(伪)随机数,保存在Numpy ndarray中。
'''
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
np.random.seed(1000)
y = np.random.standard_normal(20)
x = range(len(y))
plt.plot(x, y)
plt.show()
plot会注意何时传递ndarray对象,此时没必要单独提供x值信息,只需要提供y值,plot就会以索引值作为对应的x值。如下:
'''
生成20个标准正态分布(伪)随机数,保存在Numpy ndarray中。
'''
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
np.random.seed(1000)
y = np.random.standard_normal(20)
plt.plot(y)
plt.show()
通过调用ndarray对象上的cumsum方法,可以获得这些数据的总和。
# 通过调用ndarray对象上的cumsum方法,可以获得这些数据的总和
plt.plot(y.cumsum())
plt.show()
默认绘图样式不能满足报表,一般都需要自定义样式。可以修改轴的范围,添加网格等,
# 上述默认绘图样式不能满足报表,一般都需要自定义样式。
plt.plot(y.cumsum())
plt.grid(True) # 添加网格
plt.axis('tight') # 修改轴范围,tight使所有数据可见
plt.show()
设置坐标轴的最小值最大值范围,通过xlim,ylim进行设置
# 可以设置坐标轴的最小值和最大值
plt.plot(y.cumsum())
plt.grid(True)
plt.xlim(-1, 20)
plt.ylim(np.min(y.cumsum()) - 1,
np.max(y.cumsum()) + 1)
plt.show()
为了让图表更容易理解,可以添加附加的信息。
# 为了让图标更容易理解,需要加些附加的信息
plt.figure(figsize=(7, 4))
plt.plot(y.cumsum(), 'b', lw=1.5) # 线宽1.5,蓝色直线
plt.plot(y.cumsum(), 'ro') # 红色圆点
plt.grid(True)
plt.axis('tight')
plt.xlabel('index') # x轴标识
plt.ylabel('value') # y轴标识
plt.title('A Simple Plot') # 标题
plt.show()
这里颜色的缩写如下:
字符 | 颜色 |
b | 蓝色 |
g | 绿色 |
r | 红色 |
c | 青色 |
m | 品红 |
y | 黄色 |
k | 黑色 |
w | 白色 |