
python爬虫
Python爬虫相关
夏2同学
这里是属于代码的世界,没有花俏艳丽的魔法,有的,仅仅是繁衍到巅峰的代码!
展开
-
【Selenium】导出成py脚本的基础使用
0. Selenium简介Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。主流浏览器都支持。例如firefox,在插件市场里面就可以直接下载selenium IDE。1. 脚本录制2. 导出成Py脚本3. 运行脚本导出脚本成功,桌面就出现了一个.py文件。但是这时候是没办法直接运行的。因为还缺少,运行脚本所需要的驱动。https://github.com/mozilla/geckodriver/releas原创 2021-04-30 12:23:17 · 5671 阅读 · 3 评论 -
基于selenium实现12306的登录操作(图形验证码识别)
说明12306 会有如下一个图形验证码识别点击,所以必须得先点击正确图片,才能继续进行操作。基本步骤selenium打开对应网站,并进行截图将图片截取出对应验证码所在图片通过超级鹰识别出要点击的图片坐标点击相应图片坐标输入用户名和密码点击登录,完成12306的登录演示操作代码# !/user/bin/env python# -*- coding: utf-8 -*-from chaojiying import get_codefrom selenium import w原创 2021-01-15 21:06:15 · 367 阅读 · 0 评论 -
python——selenium框架实现无头浏览器访问 + 规避检测配置
备注:有的时候,我们希望,selenium访问的时候,不要出现浏览器,那么就需要进行配置。具体配置看代码。运行代码# !/user/bin/env python# -*- coding: utf-8 -*-# 谷歌浏览器 - 无头界面from selenium import webdriverfrom time import sleep# 实现无可视化界面from selenium.webdriver.chrome.options import Options# 实现规避检测fr原创 2021-01-15 18:47:39 · 1500 阅读 · 7 评论 -
python实现下载任意网站所有图片
操作演示视频中爬取网站地址:https://www.ivsky.com/tupian/完整代码# !/user/bin/env python# -*- coding: utf-8 -*-# des: 下载任何网页的图片import reimport requestsdef download_img(): error_count = 0 success_count = 0 url = input('请输入您要下载的图片的网址:') headers原创 2021-01-11 21:20:28 · 2682 阅读 · 0 评论