利用pandas进行数据分析之三:DataFrame与Series基本功能

本文介绍了Pandas中DataFrame与Series的数据结构,并重点讲解了reindex方法的应用,包括如何通过不同的参数设置来调整数据索引,以及填充缺失值的方法。

 

未经同意请勿转载http://www.cnblogs.com/smallcrystal/

前文已经详细介绍DataFrame与Series两种数据结构,下面介绍DataFrame与Series的数据基本手段

一、pandas两种数据结构的index是不可修改的,pandas对象的一个重要方法是reindex

>>> f

lie     pop state  year

suoyin                 

a       1.5  ohio  2000

b       1.3  ohio  2001

c       1.7  ohio  2002

d       2.0   nev  2003

e       3.5   nev  2004

>>> f.reindex(list('bcadef'))

lie     pop state    year

suoyin                   

b       1.3  ohio  2001.0

c       1.7  ohio  2002.0

a       1.5  ohio  2000.0

d       2.0   nev  2003.0

e       3.5   nev  2004.0

f       NaN   NaN     NaN

>>> f.reindex(list('bcadef'),fill_value=0)#缺失值用0填充

lie     pop state  year

suoyin                 

b       1.3  ohio  2001

c       1.7  ohio  2002

a       1.5  ohio  2000

d       2.0   nev  2003

e       3.5   nev  2004

f       0.0     0     0

#method选项对缺失值所插值处理,ffill/pad:前向填充值;bfill/backfill:后向填充值 

>>> f.reindex(list('bcadef'),method='ffill')

lie     pop state  year

suoyin                 

b       1.3  ohio  2001

c       1.7  ohio  2002

a       1.5  ohio  2000

d       2.0   nev  2003

e       3.5   nev  2004

f       3.5   nev  2004

#DataFrame数据格式,reindex不仅可以修改行索引,也可以修改列。

>>> f.reindex(columns=['pop','year','state','add'])

lie     pop  year state  add

suoyin                      

a       1.5  2000  ohio  NaN

b       1.3  2001  ohio  NaN

c       1.7  2002  ohio  NaN

d       2.0  2003   nev  NaN

e       3.5  2004   nev  NaN

转载于:https://www.cnblogs.com/smallcrystal/p/5810485.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值