pandas教程[9]MultiIndex用法

#coding:utf-8
#在pandas的DataFrame中经常使用多个索引,在pandas中成为MultiIndex对象,这篇文章介绍一下MultiIndex创建和使用方法:
import pandas as pd
import numpy as np
import pandas.util.testing as tm

print ("1-创建两个<type 'numpy.ndarray'>对象-分别为colors和foods")
colors=tm.np.random.choice(['red','green'],size=10)#testing 只是把一些常用的功能集中到一块而已~它原来的choice()就是 numpy.random里面的choice()
foods=tm.np.random.choice(['eggs','ham'],size=10)
#打印出这两个数组来查看一下,注意tm.choice创建的数组是随机的,你利用同样的代码创建的数组和我的可能不一样
print (colors)
print (foods)

print ("2-创建 MultiIndex对象,然后创建DataFrame对象(其中使用index=index参数)")
index=pd.MultiIndex.from_arrays([colors,foods], names=['color','food'])
df=pd.DataFrame(np.random.randn(10,2),index=index)

print (df)

#如何利用索引筛选数据:使用query()
print ("3-如何利用索引筛选数据-使用query()\n{}\n".format(df.query('color=="red"')))
grouped=df.groupby(level='food')
print ("4-还可以在分组中使用索引-使用level\n{}\n".format(grouped.sum()))

print ("5-删除或更改 索引名称-如果删除了名称-我们只能使用ilevel_0表示第一个索引 ")
df.index.names=[None,None]
print (df.query('ilevel_0=="red"'))

print ("6-分组中也是一样,删除掉索引名称以后,只能使用数字1表示第二个索引")
grouped=df.groupby(level=1)
print (grouped.sum())

 

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值