5.Pandas
5.1Pandas介绍
1. pandas概念
开源的数据挖掘库
用于数据探索
封装了matplotlib,numpy
2. 案例知识点
1.创建DataFrame
pd.DataFrame(ndarray)
2.创建日期
pd.date_range()
start – 开始日期
end – 结束日期
periods – 时间跨度
freq – 统计时间方式
3. DataFrame介绍 – 类比二维数组[***]
1. dataframe属性
对象.shape
对象.index
对象.columns
对象.values
对象.T
对象.head()
对象.tail()
2. dataframe设置索引
1.修改行列索引
必须整行或者整列去进行修改
2.重设索引
对象.reset_index()
3.设置新索引
对象.set_index()
如果设置索引是两个的时候就是multiIndex
4. MultiIndex和panel – 类比三维数组[**]
1.MultiIndex
对象.index
对象.index.names
2.panel – 已经弃用,了解
直接没法进行查看里面的值,需要通过索引获取
对象[:, :, “”]
5. Series – 一维数组[**]
1.创建
通过ndarray创建
指定索引创建
通过字典创建
2.属性
对象.index
对象.values