使用pandas和np.where函数获取包含缺失值的行索引列表
在数据分析中,检测缺失值是非常重要的一个步骤。在实际应用中,可能会遇到需要获取包含缺失值的行索引列表的情况。本文将介绍如何使用pandas和np.where函数计算返回dataframe中指定数据列包含缺失值的行索引列表list。
首先,我们需要导入需要的库并生成一个简单的数据集。
import pandas as pd
import numpy as np
# 创建一个包含缺失值的数据集
data = {'A': [1, 2, 3, np.nan, 5],
'B': [np.nan, 2, 3, 4, np.nan],
'C': [1, np.nan, np.nan, 4, 5]}
df = pd.DataFrame(data)
以上代码生成了一个包含缺失值的数据集df
。
接下来,我们可以使用np.where()
函数来查找包含缺失值的行索引列表。以下是示例代码:
# 查找包含缺失值的行索引列表
missing_rows = np.where(df.isnull().any(axis=1))[0].tolist()
print(missing_rows)
代码中,df.isnull().any(axis=1)
用于检查每行是否包含缺失值ÿ