- 博客(5)
- 收藏
- 关注

原创 python爬虫:用scrapy框架爬取链家网房价信息并存入mongodb
1.目标界面:https://dg.lianjia.com/ershoufang/2.爬取的信息:①标题 ②总价 ③小区名 ④所在地区名 ⑤详细信息 ⑥详细信息里的面积3. 存入:MongoDB上面链接是东莞的二手房信息,如果需要爬取别的信息更改url即可,因为网页结构没变:https://bj.lianjia.com/ershoufang/ 北京二手房信息https://gz.lianjia.com/ershoufang/ 广州二手房信息https://gz.lianjia.com/er
2021-03-22 20:42:20
1890
3
原创 python爬虫:用无头浏览器selenium爬取taptap游戏榜单并保存为csv
用selenium爬取taptap游戏榜单,并保存为csv。网站:https://www.taptap.com/top/download字段:榜单、游戏名称、排名、厂商、评分、游戏类型。代码如下:from selenium import webdriver # 引入webdriverfrom selenium.webdriver.support.wait import WebDriverWait # 元素定位要用import t
2021-03-21 22:42:44
2004
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人