1.pylab模块
颜色:b,g,r,c,m,y,k,w
符号: ^,v,<,>,s,+,x,D,d,1,2,3,4,h,H,p,l,_,-,- -,-.,.,,,o
2.简单绘图
3.
解决matplotlib文字无法显示问题
(1)直接在https://us-logger1.oss-cn-beijing.aliyuncs.com/SimHei.ttf下载字体,进行汉化
(2)找到文件中matplotlib存放位置
(3)将下载字体放到matplotlib目录下
(4)修改matplotlibrc的内容
下面是加添加的文件名
(5)删除 matplotlib 缓冲
删除c:\ users\用户名\.matplotlib 文件夹
(6)重启Jupyter Notebook
补上plt.rcParams['font.sans-serif'] = ['SimHei'],如果不执行前面的操作,直接不上这句话,还是会有红色报错。
坐标轴有问题加这句话,配置也有加了
2023.6.13
1.使用面向对象思想画图
Figure类
matplotlib.figure模块包含Figure类,它是所有plot元素的顶级容器,通过从pyplot模块调用figure()函数来实例化Figure对象
ax.legend()
作用:为绘图图形添加了一个图例
原型:
legend()
legend(labels)
legend(handles,labels)
legend(handles,labels,loc)
ax.plot()
作用:这是轴类的基本方法,它将一个数组的值与另一个数组的值绘制为线或标记原型:
ax.plot(*args,scalex=True,scaley=True,data=None,**kwargs)
ax.plot([x],y,[fmt],*,data=None,**kwargs)
ax.plot([x],y,[fmt],[x2],y2,[fmt2],...,**kwargs)
2023.6.14
1.axes和figure对象的关系
2.画布上创建多个子图
subplot()
原型: plt.subplot(Nrows,ncols,index)
作用:返回给定网格位置的axes对象
说明:
1。在当前图中,该函数创建并返回一个Axes对象,在ncolsaxes的nrows网格的位置索引1.处。索引从1到nrows*ncols,以行主顺序递增。如果nrows,ncols和index都小于10。索引也可以作为单个,连接,三个数字给出
2.例如,subplot(2,3,3)和subplot(233)都在当前图形的右上角创建一个轴,占据图形高度的一半和图形宽度的三分之一
3.创建子图将删除任何与其重叠的预先存在的子图,而不是共享边界
plt.figure(figsize=(a,b))和plt.subplot()函数_Jennie_J的博客-优快云博客
subplots()
原型: plt.subplots(nrows,ncols)
作用:它充当实用程序包装器,并在单个调用中帮助创建子图的公共布局,包括封闭的图形对象。该函数返回一个图形对象和一个包含等于nrows* ncols的轴对象的元组,每个轴对象都可通过索引访问
参数:此函数的两个整数参数指定子图网格的行数和列数
subplot2grid()
特点:在网格的特定位置创建轴对象提供了更大的灵活性,还允许轴对象跨越多个行或列
通过在同一图形画布中添加另一个轴对象来在同一图中添加插入图
figure类的add_subplot()函数
2023.6.19
1.网格
axes对象的grid()函数将图中网格的可见性设置为True或False。还可以显示网格的主要/次要或两者刻度,还可以在grid()函数中设置color,linestyle和linewidth属性
2023.6.21
1.设置轴线
通过spines["轴线位置"].set_类型(),可调整轴线颜色(也可使其不出现=无色)、宽度
格式化轴
需求:有时候一个或几个点比大量数据大得多,在这种情况下,轴的比例需要设置为对数(log)而不是正常比例
原理:这种对数标度在Matplotlib中可以通过将axes对象的xscale或vscale属性设置为log,有时还需要在轴编号和轴标签之间显示一些额外的距离,任一轴(x或y或两者)的labelpad属性都可以设置为所需的值
设置限制
需求:将x轴上的限制格式化为(0到10)和y轴(0到10000)
设置刻度和刻度标签
刻度:是表示轴上数据点的标记。到目前为止,Matplotlib在我们之前的所有例子中都自动接管了轴上间隔点的任务。Matplotlib的默认刻度定位器和格式化器在很多常见情况下通常都足够了。也可以明确提及刻度线的位置和标签以满足特定要求
xticks()和yticks()
作用:将列表对象作为参数,列表中的元素表示将显示刻度的相应操作的位置
set_xlabels()和set_ylabels()
设置刻度线的标签
设置轴线类型
原型: axis("xxx”)
重用类型:tight off equal
2023•6.23
Jupyter会在页面显示有这张图
2.绘图
【1】条形图
条形图是一种图表或图形,它品示带有矩形条的分类数据,其高度或长度与它们所代表的值成比例。条形图显示了离散类别之间的比较,图表的一个轴显示要比较的特定类别,另一个轴表示测量值
当比较多个数量和更改一个变量时,可能需要一个条形图,其中有一个颜色的条形图用于一个数量值
x➕某个数,涉及平移,如果不加的话,条形会覆盖
垂直堆叠条形图
概念:堆积条形图堆叠表示彼此顶部的不同组的条形图,结果为条形图的高度显示组的组合结果
原理:pyplot.bar()函数的可选bottom参数指定条的起始值。它不是从零运行到一个值,而是从底部到值。第一次调用pyplot.bar()绘制蓝条。第二次调用pyplot.bar()绘制红色条形图,蓝色条形图的底部位于红色条形图的顶部
水平组合条形图
水平堆叠条形图
2023.7.4
1.直方图
直方图是数值数据分布的精确表示。它是连续变量的概率分布的估计,它是一种条形图
2.饼图
饼图只能显示一系列数据
饼图在一个数据系列中显示项目的大小(称为楔形),与项目的总和成比例
饼图中的数据点显示为整个饼图的百分比
3.散点图
散点图用于绘制水平轴和垂直轴上的数据点,以试图显示一个变量受另一个变量影响的程度
数据表中的每一行都由一个标记表示,该位置取决于其在X和Y轴上设置的列中的值
可以将第三个变量设置为对应于标记的颜色或大小,从而为该图添加另一个维度
4.箱型图
箱形图也称为须状图,显示包含最小值,第一四分位数,中位数,第三四分位数和最大值的一组数据的摘要
在方块图中,绘制从第一个四分位数到第三个四分位数的方框。垂直线穿过中间的框。须从每个四分位数到最小值或最大值
5.轮廓图
轮廓图(有时称为"水平图")是一种在二维平面上是示三维表面的方法
它绘制了y轴上的两个预测变量XY和轮廓的响应变量Z
这些轮廓有时称为z切片或等响应值
如果要查看Z如何随两个输入X和Y的变化而变化,则轮廓图是非常适用的,例如Z=f(X,Y)。两个变量函数的等值线或等值线是函数具有常数值的曲线
自变量x和y通常限于称为meshgrid的规则网格
numpy.meshgrid使用x值数组和y值数组创建一个矩形网格
6.图像内的文字、注释、箭头
注意:所有的方法会返回一个matplotlib.text.Text对象
Pillow模块处理图片
7.Matplotlib包中的图像模块
imread()
作用:用于读取float32 dtype的ndarray对象中的图像致据
翻转图像
模糊图像
切割图像
切割and颜色变换
2023.7.4
1.图像灰度化
灰度化:在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值 (又称强度值、亮度值),灰度范围为0-255。一般常用的是加权平均法来获取每个像素点的灰度值
灰度化处理: 将彩色图像转化成为灰度图像的过程成为图像的灰度化处理
作用:减少的颜色的所引起的数据量的大幅增加,相当于减少了RGB的三个向量信息,从而减少了数据量,加快了运算速度
(1)加权平均法
(2)最小值法或者是最大值法(极值法)
2023.7.11
表格数据分析
(1)导入pandas跟matplotlib.pyplot
(2)加载数据
利用pandas.read_excel方法,进行数据的加载,还有其他read_方法,看数据存储的文件类型是怎么样的。
(3)数据预处理
①合并数据
pandas.concat(),可将数据进行拼接
②删除空行
用dropna()去除空行,如若不想在原数据进行改动,inplace要置为false。
③计算出平均值
Ⅰpandas自带函数
round(data[‘属性列’].mean())
Ⅱnumpy函数处理
round(numpy.mean(data[‘属性列’]))
④频数统计
count = data[‘属性列’].value_counts(),使用value_counts()进行频数统计,如需限制条数,eg.取前十条,在末尾加[:10]
(3)数据可视化分析
拿频数统计绘制柱状图,count.plot(kind = ‘bar’),在柱状图上绘制折线图count.plot(kind = ‘line’)