在pandas的DataFrame中经常使用多个索引,在pandas中成为MultiIndex对象,这篇文章介绍一下MultiIndex创建和使用方法:
-
引入所有需要的模块

-
创建两个<type 'numpy.ndarray'>对象,分别为colors和foods

-
打印出这两个数组来查看一下,注意tm.choice创建的数组是随机的,你利用同样的代码创建的数组和我的可能不一样

-
创建MultiIndex对象,然后创建DataFrame对象(其中使用index=index参数)

-
打印一下df看看里面的数据:有两个索引color和food

-
如何利用索引来筛选数据:使用query()
结果为:
-
还可以在分组中使用索引,使用了level参数
打印结果为:
-
删除或者更改索引的名称:如果删除了名称,我们只能使用ilevel_0表示第一个索引
打印结果为:
-
分组中也是一样,删除掉索引名称以后,只能使用数字1表示第二个索引
打印结果为:
本文转载自http://jingyan.baidu.com/article/73c3ce28f0d58fe50343d9c4.html
本文介绍了Pandas中MultiIndex的创建与使用方法,包括如何创建MultiIndex对象、使用索引筛选数据、在分组中使用索引以及如何更改或删除索引名称等关键操作。

被折叠的 条评论
为什么被折叠?



