机器学习的探索性数据分析

代码解释
利用美国的房产数据来讲解数据分析部分,在做数据分析的时候主要分为数据的处理和可视化,这一部分就是我们可能会在python中用到的包的导入。matploitlib.pyplot和seaborn是我们会用到的可视化的图库。display引入的主要原因就是我们想要用它将房产网站中的图片格式转换为’svg’形式。

以上展示的就是原始的脏的数据,就是数据科学家需要将原始的数据转换为机器学习可以用的干净的数据。

有大量的列是缺数据的,如果列有30%是缺数据的就把这列丢掉
null.sum = data.isnull