来源:Python数据之道 (ID:PyDataLab)
作者:阳哥
大家好,我是阳哥。
Pandas 可以说是 在Python数据科学领域应用最为广泛的工具之一。
Pandas是一种高效的数据处理库,它以 dataframe 和 series 为基本数据类型,呈现出类似excel的二维数据。
在数据处理过程中,咱们经常会用到数据筛选,Pandas 中提供了数据筛选的多种方法,这里,阳哥来给大家分享下 在Pandas中应用 query 函数来进行数据筛选。
query 函数的一般用法如下:
df.query('expression')
文中的代码是在 Jupyter Notebook 中运行的(也可以是其他IDE),本次使用的 Pandas 版本是 1.3.0 版,如下:
import pandas as pd
print(f'pandas version: {pd.__version__}')
# pandas version: 1.3.0rc1
在开始之前,先创建一份数据,供后续使用:
data = {
'brand':['Python数据之道','价值前瞻','菜鸟数据之道','Python','Java'],
'A':[10,2,5,20,16],
'B':[4,6,8,12,10],
'C':[8,12,18,8,2],
'D':[6,18,14,6,12],
'till years':[4,1,1,30,30]
}
df = pd.DataFrame(data=data)
df
数据如下:
常用方法
筛选 "brand" 列中值为 "Python数据之道" 的行,如下:
df.query('brand == "Python数据之道"')
结果如下:
说明一下,上面代码中的单引号和双引号是可以互换的,下面的写法,其结果也是一样的:
df.query(" brand == 'Python数据之道' ")
上面用

本文介绍了Pandas中query函数的使用方法,包括通过数学表达式、变量、列表和多条件筛选数据,以及处理列名称有空格的情况,并展示了筛选后的数据列选取。query函数简化了复杂的数据筛选操作,提高了数据处理效率。
最低0.47元/天 解锁文章
3786

被折叠的 条评论
为什么被折叠?



