numpy用isnan()检查是否存在NaN(Not a Number)。
pandas用.isna()或者.isnull()检查是否存在NaN。
判断缺失值:data.isna() / data.isnull(); data.notna()/ data.notnull()
填充缺失值:data.fillna(value=" ")
删除缺失值:data.dropna()
import numpy as np
import pandas as pd
df=pd.DataFrame(np.ones([5,2]),columns=['col1','col2'])
df['col3']=['a','b','a',np.nan,np.nan]
df['col4']=[3,2,3,np.nan,2]
df=df.reindex(columns=['col3','col4','col1','col2']) #将新增的一列排在第一列
df
col3 col4 col1 col2
0 a 3.0 1.0 1.0
1 b 2.0 1.0 1.0
2 a 3.0 1.0 1.0
3 NaN NaN 1.0 1.0
4 NaN 2.0 1.0 1.0
# 元素级别的判断,把对应的所有元素的位置都列出来,元素为空或者NA就显示True,否则就是False
pd.isna(df)/df.isna()
col3 col4 col1 col2
0 False False False Fals