大家好,在数据分析中,数据过滤是常见且重要的操作。Pandas库提供了多种方法来筛选数据,其中 query
方法因其简洁和强大的表达能力受到广泛欢迎。本文将详细介绍Pandas query
方法的高级应用,助力大家在复杂数据过滤时更加得心应手。
1.Pandas的query方法
Pandas的 query
方法允许你使用类似SQL的语法对DataFrame进行数据筛选。与传统的布尔索引相比,query
方法的语法更加简洁明了,特别是在处理复杂条件时更具可读性。
首先看一个简单的示例,使用 query
方法筛选数据。
import pandas as pd
# 创建一个数据框
data = {'城市': ['北京', '上海', '广州', '深圳', '成都'],
'人口': [2154, 2424, 1530, 1340, 1630],
'GDP': [36102, 38155, 25000, 26000, 21000]}
df = pd.DataFrame(data)
# 使用query方法筛选GDP大于30000的城市
filtered_df = df.query('GDP > 30000')
print(filtered_df)
运行以上代码,输出结果:
城市 人口 GDP
0 北京 2154 36102
1 上海 2424 38155
这个示例使用 query