1、前言:上一篇写了如何用python的pytesseract库识别登录验证码,发现pytesseract识别出来并不是很准确;如果仅仅是数字的话,用ddddocr准确率更高,识别咔咔准~
2、那么,我们就先来安装ddddocr库:
pip install ddddocr
3、安装成功后,在获取验证码接口的响应数据中提取验证码的值,为base64格式

4、使用ddddocr来识别图片验证码,以下是一个示例代码:
import ddddocr
import base64
def convert_png(captcha_value)
image = captcha_value.split(",")[1] #只需要captcha_value中“base64”后面的
img = base64.b64decode(image) #将base64转换成图片
with open('captcha.png','wb') as f: #打开图片
f.write(img) #保存图片
#利用ddddocr识别验证码图片上的字符
ocr = ddddocr.DdddOcr() #实例化对象
code = ocr.classification(img) #识别图片上的字符
return code
执行后报错“欢迎使用ddddocr,本项目专注带动行业内卷,个人博客:wenanzhe.com...”
将第10行修改如下:
o

本文介绍了如何在Python中安装并使用ddddocr库来提高登录验证码的识别精度,提供了安装步骤以及处理base64格式验证码的代码示例,同时解决了识别时出现的广告显示问题。
最低0.47元/天 解锁文章
15万+

被折叠的 条评论
为什么被折叠?



