
python
不要脸的阿智
not face
展开
-
python之requests+json爬取一个用户10篇文章相关信息以及每篇文章前六页评论信息
由于本人初学爬虫没几天,所以有一些可以改进的地方希望可以得到改正! 这篇爬虫需要用到的模块不是很多 requests(重要) json(重要) pprint 对于我个人来说,模块用的越少,那么对于理解数据挖掘的信息难度就越大,越需要自己的总结归纳。 刚开始首先明确目标:通过url找到某个你想要爬取的用户首页(我爬取的微博是手机版(m.weibo.cn)的页面数据比...原创 2020-02-04 10:49:24 · 855 阅读 · 2 评论 -
python之基于selenium模块自动化爬取豆瓣31个种类前若干部(最多前八十部)电影信息保存在excel中
前言 由于我是python爬虫的初学者,所以我从selenium自动化模块开始学起,一些selenium模块安装和游览器驱动安装环境搭配的事情我就不说了。我是基于Chrome游览器的自动化处理,一些安装教程请网上自己搜索! 首先我先将一下我的大致思路: 使用游览器登陆豆瓣电影排行榜的网址https://movie.douban.com/chart 打开后台观察我需要爬取的31个...原创 2020-02-02 15:31:15 · 792 阅读 · 0 评论