学习pandas
目标1:DataFrame
import numpy as np data = np.random.normal(0,1,(10,5)) #生成10行5列数据 import pandas as pd data_add = pd.DataFrame(data) #生成行列索引 默认0~n print(data_add) #添加文字行列索引 add_row = ["第{}行".format(i) for i in range(10)] #生成第0行~第10行 add_column = pd.date_range(start = "20210721", periods=5) #生成5列日期,从2021-07-21开始 详细可baidu data_addindex = pd.DataFrame(data, index=add_row, columns=add_column) print(data_addindex) #DataFrame的常用属性 print(data_addindex.shape) #形状 print(data_addindex.index) #行索引 print(data_addindex.columns) #列索引 print(data_addindex.values) #去除行列索引剩下的数据 即data print(data_addindex.T) #转置 #DataFrame的常用方法 print(data_addindex.head()) #输出前几行 默认5行 可自定义数值 print(data_addindex.tail()) #输出后几行 默认5行 可自定义数值 #修改索引 #⚠️不能单独修改某一行/列的索引 只能整体全部一起修改 如错误示范:data_addindex.index[3] = '第99行' 会报错 data_change = ["{}行".format(i) for i in range(10)] #整体修改行索引 data_addindex.index = data_change #赋值修改好的行索引 print(data_addindex) #重设索引 print(data_addindex.reset_index(drop=True)) #重设行索引 删除旧行索引 变成0~10,reset_index()默认drop=False 表示不删除旧索引,再添加0~10 #设置新索引set_index(keys, drop = True) 默认True df = pd.DataFrame({'month':[1,2,4,6], 'year':[2019,2020,2021,2022], 'sale':[44,63,13,53]}) print(df) #设置month为新索引 print(df.set_index('month')) #设置多个索引值,year、month print(df.set_index(['year','month'])) #通过刚刚的设置后,这样DataFrame就变成了一个具有MultiIndex的DataFrame(存储三维数据) #创建Series (DtataFrame是Serise的容器) a = pd.Series(np.arange(3,9,2), index=["a","b","c"]) print(a) #也可用字典创建Serise b = pd.Series({'a':100,'b':200,'c':300}) print(b)
河南加油❤️