学习pandas
目标1:DataFrame
import numpy as np
data = np.random.normal(0,1,(10,5)) #生成10行5列数据
import pandas as pd
data_add = pd.DataFrame(data) #生成行列索引 默认0~n
print(data_add)
#添加文字行列索引
add_row = ["第{}行".format(i) for i in range(10)] #生成第0行~第10行
add_column = pd.date_range(start = "20210721", periods=5) #生成5列日期,从2021-07-21开始 详细可baidu
data_addindex = pd.DataFrame(data, index=add_row, columns=add_column)
print(data_addindex)
#DataFrame的常用属性
print(data_addindex.shape) #形状
print(data_addindex.index) #行索引
print(data_addindex.columns) #列索引
print(data_addindex.values) #去除行列索引剩下的数据 即data
print(data_addindex.T) #转置
#DataFrame的常用方法
print(data_addindex.head()) #输出前几行 默认5行 可自定义数值
print(data_addindex.tail()) #输出后几行 默认5行 可自定义数值
#修改索引
#⚠️不能单独修改某一行/列的索引 只能整体全部一起修改 如错误示范:data_addindex.index[3] = '第99行' 会报错
data_change = ["{}行".format(i) for i in range(10)] #整体修改行索引
data_addindex.index = data_change #赋值修改好的行索引
print(data_addindex)
#重设索引
print(data_addindex.reset_index(drop=True)) #重设行索引 删除旧行索引 变成0~10,reset_index()默认drop=False 表示不删除旧索引,再添加0~10
#设置新索引set_index(keys, drop = True) 默认True
df = pd.DataFrame({'month':[1,2,4,6],
'year':[2019,2020,2021,2022],
'sale':[44,63,13,53]})
print(df)
#设置month为新索引
print(df.set_index('month'))
#设置多个索引值,year、month
print(df.set_index(['year','month'])) #通过刚刚的设置后,这样DataFrame就变成了一个具有MultiIndex的DataFrame(存储三维数据)
#创建Series (DtataFrame是Serise的容器)
a = pd.Series(np.arange(3,9,2), index=["a","b","c"])
print(a)
#也可用字典创建Serise
b = pd.Series({'a':100,'b':200,'c':300})
print(b)
河南加油❤️
Pandas入门:DataFrame操作详解
1942

被折叠的 条评论
为什么被折叠?



