掌握Python Pandas中的多重索引技巧

Python Pandas多重索引技巧全掌握

最新推荐文章于 2025-11-24 12:40:06 发布

原创

最新推荐文章于 2025-11-24 12:40:06 发布 · 1.2k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#python #pandas #开发语言

大家好，在数据分析中，处理复杂的多维数据是常见的需求。Python的Pandas库提供了强大的多重索引（MultiIndex）功能，能够灵活地管理和分析多层级的数据结构。本文将介绍Pandas中的多重索引，探讨如何创建、操作和重设多重索引，并通过具体的示例代码展示其在实际应用中的强大功能。

1.多重索引概述

多重索引是一种层次化的索引方式，它允许在DataFrame或Series中使用多个级别的索引。通过多重索引，我们可以更清晰地表达数据的层级关系，使得处理复杂数据集变得更加直观和高效。

可以通过多列数据创建多重索引，从而将DataFrame组织成具有层次结构的形式。

import pandas as pd

# 创建一个包含多个级别的DataFrame
data = {'城市': ['北京', '北京', '上海', '上海', '广州', '广州'],
        '年份': [2020, 2021, 2020, 2021, 2020, 2021],
        '人口': [2154, 2160, 2424, 2430, 1530, 1540],
        'GDP': [36102, 37200, 38155, 39400, 25000, 26000]}

df = pd.DataFrame(data)

# 设置多重索引
df.set_index(['城市', '年份'], inplace=True)

print(df)

运行以上代码，输出结果：

         人口    GDP
城市  年份              
北京  2020  2154  36102
    2021  2160  37200
上海  2020  2424  38155
    2021  2430  39400
广州  2020  1530  25000
    2021  1540  26000

在这个示例中，通过 set_index() 函数将 城市 和 年份 两列设置为多重索引，生成了一个具有层次结构的DataFrame。

2.多重索引的基本操作

一旦我们创建了多重索引，Pandas提供了多种方法来操作和查询这些数据，包括选择、切片、交换层级、重设索引等。

2.1 选择和切片多重索引

多重索引使得我们可以轻松地选择或切片数据。例如，可以选择某个城市的数据，或者选择特定年份的数据。

import pandas as pd

# 创建一个包含多个级别的DataFrame
data = {'城市': ['北京', '北京', '上海', '上海', '广州', '广州'],
        '年份': [2020, 2021, 2020, 2021, 2020, 2021],
        '人口': [2154, 2160, 2424, 2430, 1530, 1540],
        'GDP': [36102, 37200, 38155, 39400, 25000, 2