写在前面
上周我们读取完了数据(Python数据分析实战:获取数据),下面就要对数据进行清洗了,首先是对缺失值的处理。缺失值也就是空值,先找出来再处理。
查看缺失值
可以使用isnull方法来查看空值,得到的结果是布尔值。
# 查看缺失值
df_list.isnull()
结果:

对于小的数据集来说,可以这样看,但对于大的数据集这样查看空值貌似没什么意义,没关系,还有其他方法,可以使用info方法
# 查看空值
df_list.info()
结果:

info方法可以看到字段的数据类型以及每个字段下有多少个非空值,可以看到neighbourho

本文介绍了在Python中处理数据分析时遇到的缺失值问题,包括如何查看和处理缺失值。通过使用pandas库的isnull、info和dropna等方法,展示了检查和删除缺失值的步骤,并探讨了缺失值的删除策略。此外,还讨论了用fillna方法填充缺失值,如用0、均值或众数等策略。最后,文章提到了在某些情况下保留缺失值的合理性,并预告了后续将处理重复值和异常值的内容。
最低0.47元/天 解锁文章
768

被折叠的 条评论
为什么被折叠?



