使用 Pandas query 函数根据组合条件删除 DataFrame 中不符合要求的数据行
在数据分析和处理过程中,我们经常需要根据数据的某些属性筛选出符合要求的数据行。Pandas 是 Python 中一个重要的数据分析库,提供了多种数据操作和分析工具,其中包括 query 函数用于基于组合条件选择数据行。本文将介绍如何使用 Pandas 的 query 函数根据组合条件删除 DataFrame 中不符合要求的数据行,并提供相应的源代码。
- 创建 DataFrame 数据
首先,我们需要创建一个简单的 DataFrame 数据用于演示。下面的代码将创建一个包含学生姓名、年龄和成绩的 DataFrame 数据:
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily', 'Frank'],
'Age': [18, 17, 19, 16, 20, 18],
'Score': [82, 79, 90, 65, 88, 77]
}
df = pd.DataFrame(data)
- 使用 query 函数筛选数据
接下来,我们将使用 Pandas 的 query 函数筛选数据。假设我们需要删除年龄小于 18 岁或者成绩低于 80 分的学生数据,可以使用以下代码:
df = df.query('Age >= 18 and Score >= 80')
上述代码中,q