https://www.kaggle.com/rtatman/data-cleaning-challenge-handling-missing-values
今天学习kaggle上的缺失值处理课程,学习记录,可能不太严谨,请指正。
1.观察
观察几个样本数据或者所有数据有无NaN 或者None
1.1读取数据,显示数据,肉眼观察
1.2 python中用下列方法
a.data.isnull( ) ----对整体的series或者dataframe判断
isnan(data) ----对某一行进行判断(这里我也不是特别明白)
二者返回False和True,False代表没有缺失值,True代表有缺失值
参考:https://blog.youkuaiyun.com/xidianliutingting/article/details/62041891
b.统计有多少缺失值
missing_cou