爬取链家二手房房价数据存入mongodb并进行分析

感谢您的关注!需要完整源码评论区获取~
【实验目的】
1. 使用 python 将爬虫数据存入 mongodb;
2. 使用 python 读取 mongodb 数据并进行可视化分析。
【实验原理】
       MongoDB 是文档数据库,采用 BSON 的结构来存储数据。在文档中可嵌套其他文档
类型,使得 MongoDB 具有很强的数据描述能力。本节案例使用的数据为链家的租房信
息,源数据来自于链家网站,所以首先要获取网页数据并解析出本案例所需要的房源信
息,然后将解析后的数据存储到 MongoDB 中,最后基于这些数据进行城市租房信息的
查询和聚合分析等。
【实验环境】
        OS:Ubuntu16.04
        Python3
        MongoDB:v3.6
【实验步骤】
        一:使用 python 将爬虫数据存入 mongodb
        分析租房信息首先要获取原始的房源数据,本例使用 python 爬虫技术获取链家网页
的新房楼盘信息。如图所示,对房源信息进行分析需要获取房源所在区域、小区名、房
型、面积、具体位置、价格等信息。
        

分析数据:

执行loupanAnaly.py文件:

mongo shell终端 数据分析:

(1)求每个区域的平均房价和最高房价:

(2)查找所有住宅区域的平均房价:

(3)查看某个特定区域的所有房价信息

(4)查找某个区域的最大房价:

(5)按区域统计房源数量

(6)找出最贵的房源信息

(7)区域房价的分布(价格区间统计)

(8)按楼盘开发商统计房源均价

(9)统计每个区域的房价标准差

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我写的代码全是bug

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值