Selenium破解验证码登录实战

Selenium模拟登录

什么是Selenium:

  • Selenium是一个用于Web应用程序测试的工具,可以使用他用代码的方式来模拟用户的操作。
  • 主要用于自动化测试、编写脚本、爬虫等等。

破解登陆两种思路:

  • 使用Selenium 等脚本框架进行模拟操作
  • 通过阅读网页源码得知登陆逻辑,调用接口进行登陆

但部分网页源码会进行加密、混淆和压缩,使得网页源码晦涩难懂,难以知道代码逻辑

Selenium模拟操作原理

  • 前端通过html(类似于xml)的形式渲染到页面
  • 页面里的每一个元素都能从html里找到对应的标签
  • Selenium通过操作这些元素来实现我们的需求

输入用户名等信息

点击登录按钮

有时候登录完之后不能立刻获取到我们需要的登录信息,会跳到一个中间页之类的 需要使用Webdriver里的显示等待,等待页面元素加载完后才进行后续的操作

最后通过写js代码执行去获取登录信息

OCR图片识别

OCR(Optical Character Recognition,光学字符识别),针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式。

免费的OCR开源库有:Tesseract,PaddleOCR等

计算机图片原理

在计算机中,一张图片由若干个像素(色块)组成,可以将其看成是一个二维数组,数组里的每一个值记录颜色等信息 要提高OCR库的识别成功率,需要尽可能地把图片转换为白底黑字

灰度图:将图片转化为类似黑白电视的效果,将灰度值分为256阶,255代表全白,0表示全黑

二值化:将灰度图上每个像素的灰度值按照一定的规则设为0或255,呈现黑白图的效果

降噪:将图片背景上多余的像素点去掉

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值