python+selenium+百度OCR 验证码识别登录

本文介绍如何使用百度OCR服务与Selenium库自动化识别网页中的验证码,包括申请百度OCR服务、安装所需库、编写验证码识别代码及登录网站自动化流程。

百度OCR申请:
先申请一个百度账号,然后搜索百度智能云,登录进入
在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述
创建完成后会获得一个AppID,APIKey,Secret Key,等下会用到。在这里插入图片描述
接下来开始编写代码,在这之前,要安装好python3,selenium,baidu-aip(安装自行百度)
我们首先写一个百度OCR的类,第一步,导入我们需要的安装包

from os import path
from aip import AipOcr

类代码:

class BaiduOCR:
    def __init__(self, picfile):
        self.picfile = picfile

    def baiduOCR(self):
        """利用百度api识别文本,并保存提取的文字
        picfile:    图片文件名
        """
        filename = path.basename(self.picfile)
        # 你的AppID,APIKey,Secret Key
        APP_ID = '1852****'
        API_KEY = 'b5jRwiOvBFmyeTD******'
        SECRECT_KEY = '0UYTZDzFCcd2WExctrbHMxM***********'
        client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)

        i = open(self.picfile, 'rb')
        img = i.read()
        print("正在识别图片:\t" + filename)
      	# basicGeneral : 通用文字识别
		# basicAccurate : 通用文字识别(高精度版)
		# general : 通用文字识别(含位置信息版)
		# accurate : 通用文字识别(含位置高精度版)
		# enhancedGeneral : 通用文字识别(含生僻字版)
		# webImage : 网络图片文字识别
		# 还有更多参数可选,具体详情可自查Api文档
        message = client.webImage(img)  # 网络文字识别,每天 50 000 次免费
        # message = client.basicAccurate(img)   # 通用文字高精度识别,每天 800 次免费
        # 打印信息可注释掉,此处是为了调试
        print
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值