python
不会织网的蜘蛛精
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
简单易学python小爬虫:用requests+BeautifulSoup爬取豆瓣TOP250
爬取目标网址:https://movie.douban.com/top250 分析网站源代码,找到我们要爬取的部分。 可以发现目标数据存放在ol这个节点里面,而每一部电影又是存放在li节点里面,我们可以用requests来获得这个网站的文本信息,然后用BeautifulSoup来解析,获得我们想要的数据及信息。 我是在看中国慕课嵩天老师爬虫课学习的获取网页通用代码 import requests ...原创 2019-04-18 23:56:51 · 1179 阅读 · 0 评论 -
用BeautifulSoup+requests+pyecharts爬取中国天气网,找到气温最高的前十城市,并进行数据的可视化。
目标网站:http://www.weather.com.cn/textFC/hb.shtml 打开浏览器的检查,找到我们想要的数据所存放的节点。 可以发现,这张网页的所有省份里面的城市信息是存放在(div class =‘conMidtab’)这个节点里面 ...原创 2019-04-20 11:30:48 · 976 阅读 · 2 评论
分享