pandas数据分析项目

用到的数据和代码都在我的资源里,免费下载,看看能不能下载,不能我再搞,本来数据就是免费的,我上传后给我自动搞成了vip

1.导入相关库

先把常用的matplotlib,pandas,seaborn导入进去,并处理文字的显示问题

2.导入数据

cityaddressareafloornamepriceprovinceroomstowardunityearorigin_url
0合肥龙岗-临泉东路和王岗大道交叉口东南角90㎡中层(共18层)圣地亚哥128万安徽3室2厅南北向14222元/㎡2013年建https://hf.esf.fang.com/chushou/3_404230646.htm
1合肥龙岗-临泉东路和王岗大道交叉口东南角90㎡中层(共18层)圣地亚哥128万安徽3室2厅南北向14222元/㎡2013年建https://hf.esf.fang.com/chushou/3_404230646.htm
2合肥生态公园-淮海大道与大众路交口95㎡中层(共18层)正荣·悦都荟132万安徽3室2厅南向13895元/㎡2019年建https://hf.esf.fang.com/chushou/3_404304901.htm
3合肥生态公园-淮海大道与大众路交口95㎡中层(共18层)正荣·悦都荟132万安徽3室2厅南向13895元/㎡2019年建https://hf.esf.fang.com/chushou/3_404304901.htm
4合肥撮镇-文一名门金隅裕溪路与东风大道交口37㎡中层(共22层)文一名门金隅32万安徽2室1厅南北向8649元/㎡2017年建https://hf.esf.fang.com/chushou/3_404372096.htm

3.数据概览

        在分析数据之前我们要先看一下数据大致情况,尤其是info检查数据类型和缺失值

4.数据清洗

        ①删除无用的列

        ②检查缺失值--这里我们选择直接删除缺失值

        ③删除重复值

        ④完成相应的数据类型的转换

        ⑤异常值的处理

5.数据特征的构造

        ①提取地址当中的二级地区

        ②提取楼层当中的三个等级

        ③判断是否是直辖市

        ④提取卧室和厅的数量

        ⑤计算楼层的年龄

6.问题分析及可视化

(我们只选择几个典型的问题)

        ①哪些变量最影响房价?

        ②房价的全国分布

        ③朝向对价格的差异

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值