Selenium模拟登录
什么是Selenium:
- Selenium是一个用于Web应用程序测试的工具,可以使用他用代码的方式来模拟用户的操作。
- 主要用于自动化测试、编写脚本、爬虫等等。



破解登陆两种思路:
- 使用Selenium 等脚本框架进行模拟操作
- 通过阅读网页源码得知登陆逻辑,调用接口进行登陆
但部分网页源码会进行加密、混淆和压缩,使得网页源码晦涩难懂,难以知道代码逻辑


Selenium模拟操作原理
- 前端通过html(类似于xml)的形式渲染到页面
- 页面里的每一个元素都能从html里找到对应的标签
- Selenium通过操作这些元素来实现我们的需求

输入用户名等信息

点击登录按钮

有时候登录完之后不能立刻获取到我们需要的登录信息,会跳到一个中间页之类的 需要使用Webdriver里的显示等待,等待页面元素加载完后才进行后续的操作


最后通过写js代码执行去获取登录信息

OCR图片识别
OCR(Optical Character Recognition,光学字符识别),针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式。
免费的OCR开源库有:Tesseract,PaddleOCR等
计算机图片原理
在计算机中,一张图片由若干个像素(色块)组成,可以将其看成是一个二维数组,数组里的每一个值记录颜色等信息 要提高OCR库的识别成功率,需要尽可能地把图片转换为白底黑字
灰度图:将图片转化为类似黑白电视的效果,将灰度值分为256阶,255代表全白,0表示全黑
二值化:将灰度图上每个像素的灰度值按照一定的规则设为0或255,呈现黑白图的效果
降噪:将图片背景上多余的像素点去掉



15万+

被折叠的 条评论
为什么被折叠?



