python+selenium+百度OCR 验证码识别登录

最新推荐文章于 2025-10-20 15:10:06 发布

原创

最新推荐文章于 2025-10-20 15:10:06 发布 · 2k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#python #selenium

本文介绍如何使用百度OCR服务与Selenium库自动化识别网页中的验证码，包括申请百度OCR服务、安装所需库、编写验证码识别代码及登录网站自动化流程。

百度OCR申请：
先申请一个百度账号，然后搜索百度智能云，登录进入
在这里插入图片描述

创建完成后会获得一个AppID，APIKey，Secret Key，等下会用到。
接下来开始编写代码，在这之前，要安装好python3，selenium，baidu-aip(安装自行百度)
我们首先写一个百度OCR的类，第一步，导入我们需要的安装包

from os import path
from aip import AipOcr

类代码：

class BaiduOCR:
    def __init__(self, picfile):
        self.picfile = picfile

    def baiduOCR(self):
        """利用百度api识别文本，并保存提取的文字
        picfile:    图片文件名
        """
        filename = path.basename(self.picfile)
        # 你的AppID，APIKey，Secret Key
        APP_ID = '1852****'
        API_KEY = 'b5jRwiOvBFmyeTD******'
        SECRECT_KEY = '0UYTZDzFCcd2WExctrbHMxM***********'
        client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)

        i = open(self.picfile, 'rb')
        img = i.read()
        print("正在识别图片：\t" + filename)
      	# basicGeneral : 通用文字识别
		# basicAccurate : 通用文字识别(高精度版)
		# general : 通用文字识别(含位置信息版)
		# accurate : 通用文字识别(含位置高精度版)
		# enhancedGeneral : 通用文字识别(含生僻字版)
		# webImage : 网络图片文字识别
		# 还有更多参数可选，具体详情可自查Api文档
        message = client.webImage(img)  # 网络文字识别，每天 50 000 次免费
        # message = client.basicAccurate(img)   # 通用文字高精度识别，每天 800 次免费
        # 打印信息可注释掉，此处是为了调试
        print