
数据分析
文章平均质量分 56
记录用于数据分析的三大python库:numpy,pandas,matplotlib
One_T.
IT小白
展开
-
numpy——文件读取与保存
numpy中的文件读取与保存import numpy as npimport pickle读取1.dst = numpy.load(file, mmap_mode=None, allow_pickle=False, fix_imports=True, encoding=‘ASCII’)file:文件名或者路径加文件名或者文件对象allow_pickle:为True时,可以从将pkl保存的文件读入,但是这样不好,一般默认为Falsef = open("a", mode="rb")# 用文原创 2022-04-24 22:12:23 · 3022 阅读 · 0 评论 -
matplotlib——画布分辨率和尺寸
画布的分辨率与大小import numpy as npimport matplotlib.pyplot as plt%matplotlib inline默认的画布plt.plot()设置分辨率plt.rcParams['figure.dpi'] = 100plt.plot()设置图片尺寸plt.rcParams['figure.figsize'] = (8.0, 4.0)plt.plot()...原创 2022-03-30 17:14:38 · 4304 阅读 · 0 评论 -
matplotlib——图形对象figure及区域对象axe
创建图形对象import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinex = np.linspace(-10, 10)y = x**2fig = plt.figure('f1', figsize=(6, 4), dpi=50, facecolor='gray', frameon=True)plt.plot(x, y)绘制多子图figure 是绘制对象(可理解为一个空白的画布),一个 figure 对原创 2022-03-30 17:10:53 · 1857 阅读 · 0 评论 -
matplotlib——坐标轴相关设置
坐标轴设置import matplotlib.pyplot as pltimport numpy as np%matplotlib inline左边的视图里有四条边,称为视图的spine——脊柱。如何对spine操作得到右图的效果?① 去除上面和右面的spine;②再把左面的spine移至中间;③ 再把下面的spine 向上移,使得两个0值重合所有对spine的操作均在 gca() 方法中完成, gca——get current axesx = np.linspace(-50, 51)原创 2022-03-30 14:01:09 · 9099 阅读 · 0 评论 -
matplotlib——图例legend相关设置
图例 legend()import numpy as npimport matplotlib.pyplot as plt%matplotlib inline什么是图例?图例是集中于图的一角或者一侧的各种符号和颜色代表内容的说明,有助于更好地理解图设置方法①直接在plot中设置label属性值 最后调用legend() 方法即可x = np.linspace(-5, 5)y = np.random.randint(10, 40, len(x))z = np.random.randint(原创 2022-03-29 13:07:11 · 7664 阅读 · 0 评论 -
matplotlib——中文字体设置及show方法
中文字体设置import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinex = np.linspace(-5, 5)y = np.sin(x)plt.title('y等于sinx')plt.plot(x, y)[<matplotlib.lines.Line2D at 0x2088ed04ac0>]D:\Anaconda3\Install\lib\site-packages\IPython\co原创 2022-03-29 13:04:54 · 1980 阅读 · 0 评论 -
matplotlib——风格设置
风格设置import numpy as npimport matplotlib.pyplot as plt%matplotlib inline查看能使用哪些风格plt.style.available['Solarize_Light2', '_classic_test_patch', '_mpl-gallery', '_mpl-gallery-nogrid', 'bmh', 'classic', 'dark_background', 'fast', 'fivethirtyeig原创 2022-03-29 13:00:47 · 653 阅读 · 0 评论 -
matplotlib——基本设置
基本设置import numpy as npimport matplotlib.pyplot as plt%matplotlib inline图的外观设置plt.plot([1,2,3,4], [10, 22, 32, 6]) # 每一个轴传进去的都是一个列表xlabel 和 ylabel 分别设定轴的名字 并通过 fontsize 属性设置字体大小plt.xlabel('X', fontsize=12) plt.ylabel('Y', fontsize=原创 2022-03-29 10:44:42 · 498 阅读 · 0 评论 -
pandas——字符串操作
字符串操作import pandas as pdimport numpy as nps = pd.Series(['A', 'c', 'AGeR', 'SEW', np.nan])s0 A1 c2 AGeR3 SEW4 NaNdtype: object字符串型 Series 的大小写转换s.str.upper()0 A1 C2 AGER3 SEW4 NaNdtype: ob原创 2022-03-27 09:30:08 · 567 阅读 · 0 评论 -
pandas——常用操作
常用操作import pandas as pdimport numpy as npexample = pd.DataFrame({'Amount': [74., 235., 175., 100., 115., 245., 180., 90., 88., 129., 273., 300.], 'Category': ['Transportation', 'Grocery', 'Household', 'Entertainment',原创 2022-03-26 22:33:05 · 827 阅读 · 0 评论 -
pandas——数据透视表
数据透视表import pandas as pdexample = pd.DataFrame({'Amount': [74., 235., 175., 100., 115., 245., 180., 90., 88., 129., 273., 300.], 'Category': ['Transportation', 'Grocery', 'Household', 'Entertainment', 'Transport原创 2022-03-26 20:45:57 · 1588 阅读 · 0 评论 -
pandas——显示设置
显示设置import pandas as pddf = pd.read_csv('../../datasets/titanic/test.csv')df.head(80) PassengerId Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked原创 2022-03-26 20:06:16 · 1574 阅读 · 0 评论 -
pnadas——对象的增删查改(Series,DataFrame)
对象的增删改查import pandas as pdimport numpy as np手动方法构造Seriesdata = np.arange(10)index = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']s = pd.Series(data, index)sa 0b 1c 2d 3e 4f 5g 6h 7i 8j 9dtype: int32原创 2022-03-26 18:51:33 · 285 阅读 · 0 评论 -
pandas——数值运算操作
数值运算操作import pandas as pd可自己传入数据,指定索引名和属性名data = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['a', 'b'], columns=['A', 'B', 'C'])data A B C a 1 2 3 b 4原创 2022-03-26 18:50:26 · 1840 阅读 · 0 评论 -
pandas——数据查询与排序
pandas数据分析库原创 2022-03-26 15:24:20 · 1945 阅读 · 0 评论