Pandas - Dataframe 实现 SQL Where

Pandas中的条件筛选：SQL WHERE子句的实现

最新推荐文章于 2025-04-19 00:15:00 发布

转载最新推荐文章于 2025-04-19 00:15:00 发布 · 593 阅读

1 ·

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s/clJ9FYkdhRNXNYnaphDNow

文章标签：

#sql #python #pandas

python 专栏收录该内容

4 篇文章

订阅专栏

本文介绍了如何在Pandas中使用类似于SQL的条件筛选操作，如相等（==）、不等（!=）、大于（>）、小于（<）等，以及如何进行范围比较（>=、<=）。通过示例展示了如何根据特定列的值来过滤DataFrame的行，这对于数据处理和分析非常实用。

sql中的where语句的功能非常丰富，常用关键包括 =，<>，>=，<=，>，<，in，not in，isnull，like，and，or等关键字，下面我们就来看看，如果是在pandas中该如何实现。

>>> import pandas as pd
>>> import numpy as np
df = pd.read_excel(r'D:/myExcel/1.xlsx')
>>> df = pd.read_excel(r'D:/myExcel/1.xlsx')
>>> df
  id   name  score grade
0  a    bog   45.0     A
1  c  jiken   67.0     B
2  d    bob   23.0     A
3  b  jiken   34.0     B
4  f   lucy    NaN     A
5  e   tidy   75.0     B

1、==
即判断相等关系，和sql中的=类似

# 获取id中为'a'的行
>>> df[df['id'] =='a']
  id name  score grade
0  a  bog   45.0     A
# 获取score中分数为45的行
>>> df[df['score'] == 45]
  id name  score grade
0  a  bog   45.0     A

2、!=
即表明不相等的关系，和sql中的<>类似

# 获取id中不为'a'的行
>>> df[df['id'] !='a']
  id   name  score grade
1  c  jiken   67.0     B
2  d    bob   23.0     A
3  b  jiken   34.0     B
4  f   lucy    NaN     A
5  e   tidy   75.0     B
# 获取score中不等于45的行
>>> df[df['score'] != 45]
  id   name  score grade
1  c  jiken   67.0     B
2  d    bob   23.0     A
3  b  jiken   34.0     B
4  f   lucy    NaN     A
5  e   tidy   75.0     B

3、>,>=,<,<=
此和sql保持一致

# score需>= 45
>>> df[df['score'] >= 45]
  id   name  score grade
0  a    bog   45.0     A
1  c  jiken   67.0     B
5  e   tidy   75.0     B
# score需> 45
>>> df[df['score'] > 45]
  id   name  score grade
1  c  jiken   67.0     B
5  e   tidy   75.0     B
# score小于45
>>> df[df['score'] < 45]
  id   name  score grade
2  d    bob   23.0     A
3  b  jiken   34.0     B
# score小于等于45
>>> df[df['score'] <= 45]
  id   name  score grade
0  a    bog   45.0     A
2  d    bob   23.0     A
3  b  jiken   34.0     B