
selenium
cliviabao
这个作者很懒,什么都没留下…
展开
-
python爬虫之selenium
当网页由javascript生成且不包含ajax接口请求的时候,需要使用模拟浏览器运行的方式来爬取需要的数据。 一、安装与准备 selenium本身使用pip安装即可,除此之外还需要安装浏览器及驱动。我自己安装了chrome和firefox。 chrome对应的驱动为ChromeDriver,firefox对应的驱动为GeckoDriver。分别百度下载即可。(我下的都是最新的,历史版本需要...原创 2019-04-09 20:38:10 · 331 阅读 · 0 评论 -
python爬虫之selenium识别滑动验证码
最早在爬虫中遇到滑动验证码是在国家企业信用信息公示系统中,当时也是运用selenium来完成。现在该网站已经改为点触验证码了,故现在用bilibili登录页面作为一个示例。 一、识别思路 识别滑动验证码需要完成如下几步: 1)模拟点击验证按钮 2)得到完整的验证码图片 3)得到带缺口的验证码图片 4)比较图片的像素差异,识别缺口 5)模拟滑动动作 二、初始化 b站的登录地址为ht...原创 2019-04-11 13:32:36 · 5826 阅读 · 3 评论