pandas库简介
1.Pandas时Python的一个数据分析包,该工具为解决数据分析任务而创建
2.Pandas纳入大量库和标准数据模型,提供高效的操作数据集所需的工具。
3.Pandas提供大量能使我们快速便捷地处理数据的函数和方法。
4.Pandas是字典形式,基于NumPy创建,让NumPy为中心的应用变得更加简单。
Dataframe创建操作
date = pd.date_range('20190903', periods=6)#创造时间序列
columns_name = range(5)#range创造步长为一的数字序列
Dataframe = pd.DataFrame(np.random.randn(6, 5), index=date, columns=columns_name)
# print(np.arange(6).reshape(2,3))#arange是numpy里面带的产生默认步长为1的列表
# reshape是将一个行向量变成一个NxM的矩阵
# df1 = pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c','d'])
Dataframe的属性操作
# print(Dataframe.index)#获得Dataframe的index
# print(Dataframe.columns)#获得Dataframe的列lable
# print(Dataframe.dtypes)#查看每一列的类型
# print(Dataframe.describe())#数字总结
# print(Dataframe.T)#转置
# print(Dataframe.values)#用二维元组得到Dataframe的body
# print(Dataframe.sort_values(by=3,ascending=Ture))#按选定行进行排序
values默认是从小到大进行排序,如果想获得值前五的数据可以[-5:]
ascending为Ture时从小到大,False时从大到小
Dataframe对行和列的操作
# Author:Frank
import pandas as pd
df = pd.read_excel(r'E:\2017B_data\2017\B\附件一ÿ