李沐老师机器学习斯坦福课程笔记

机器学习的探索性数据分析

导入在这里插入图片描述

代码解释

利用美国的房产数据来讲解数据分析部分,在做数据分析的时候主要分为数据的处理和可视化,这一部分就是我们可能会在python中用到的包的导入。matploitlib.pyplot和seaborn是我们会用到的可视化的图库。display引入的主要原因就是我们想要用它将房产网站中的图片格式转换为’svg’形式。
在这里插入图片描述

以上展示的就是原始的脏的数据,就是数据科学家需要将原始的数据转换为机器学习可以用的干净的数据。

在这里插入图片描述
有大量的列是缺数据的,如果列有30%是缺数据的就把这列丢掉

#计算空数据的数目
null.sum = data.isnull
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值