python Selenium 自动填写动态验证码

最新推荐文章于 2024-08-28 15:55:14 发布

原创

最新推荐文章于 2024-08-28 15:55:14 发布 · 1.1k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#python #selenium #开发语言

自动填写动态验证码通常涉及到图像识别，因为动态验证码通常设计为防止自动化工具直接解析。以下是一般步骤，使用 Python 和 Selenium 结合 OCR（Optical Character Recognition）工具来处理动态验证码：

安装相关库：除了 Selenium，还需要安装图像处理库（如 Pillow）和 OCR 库（如 Tesseract）：

   pip install pillow pytesseract

注意：pytesseract 是 Python 接口，Tesseract 是实际的 OCR 引擎，需要单独下载并安装。

配置 Tesseract：确保已经下载并安装了 Tesseract，并将其添加到系统路径中。

截取验证码：使用 Selenium 截取包含验证码的图像：

python

   from PIL import ImageGrab
   import time

   # 等待验证码出现
   # 可能需要使用 WebDriverWait，等待特定元素可见
   element = WebDriverWait(driver, 10).until(
       EC.presence_of_element_located((By.ID, 'captcha-image')))

   # 截图
   driver.save_screenshot('captcha.png')

   # 或者使用 ImageGrab 获取屏幕上的验证码部分
   box = element.location + (element.size)
   im = ImageGrab.grab(box)
   im.save('captcha.png')

识别验证码：使用 pyt