流水账第六章

学习pandas

目标1:DataFrame

import numpy as np
data = np.random.normal(0,1,(10,5)) #生成10行5列数据

import pandas as pd
data_add = pd.DataFrame(data)   #生成行列索引 默认0~n
print(data_add)

#添加文字行列索引
add_row = ["第{}行".format(i) for i in range(10)]     #生成第0行~第10行
add_column = pd.date_range(start = "20210721", periods=5)  #生成5列日期,从2021-07-21开始 详细可baidu
data_addindex = pd.DataFrame(data, index=add_row, columns=add_column)
print(data_addindex)

#DataFrame的常用属性
print(data_addindex.shape)      #形状
print(data_addindex.index)      #行索引
print(data_addindex.columns)    #列索引
print(data_addindex.values)     #去除行列索引剩下的数据 即data
print(data_addindex.T)          #转置


#DataFrame的常用方法
print(data_addindex.head())     #输出前几行 默认5行 可自定义数值
print(data_addindex.tail())     #输出后几行 默认5行 可自定义数值

#修改索引
#⚠️不能单独修改某一行/列的索引 只能整体全部一起修改 如错误示范:data_addindex.index[3] = '第99行' 会报错
data_change = ["{}行".format(i) for i in range(10)]      #整体修改行索引
data_addindex.index = data_change                       #赋值修改好的行索引
print(data_addindex)

#重设索引
print(data_addindex.reset_index(drop=True))  #重设行索引 删除旧行索引 变成0~10,reset_index()默认drop=False 表示不删除旧索引,再添加0~10


#设置新索引set_index(keys, drop = True) 默认True
df = pd.DataFrame({'month':[1,2,4,6],
                   'year':[2019,2020,2021,2022],
                   'sale':[44,63,13,53]})
print(df)
#设置month为新索引
print(df.set_index('month'))
#设置多个索引值,year、month
print(df.set_index(['year','month']))       #通过刚刚的设置后,这样DataFrame就变成了一个具有MultiIndex的DataFrame(存储三维数据)

#创建Series (DtataFrame是Serise的容器)
a = pd.Series(np.arange(3,9,2), index=["a","b","c"])
print(a)
#也可用字典创建Serise
b = pd.Series({'a':100,'b':200,'c':300})
print(b)

 河南加油❤️

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值