目录
哈喽O(∩_∩)O
:.,,.-:*``*:-.,,.-:*``*:
╭╧╮ ╭╧╮ ╭╧╮ ╭╧╮
║周║║末║║快║║乐║
└﹏┘└﹏┘└﹏┘└﹏┘
* * * * * * * * * * * * *
╒╧╕ ╒╧╕ ╒╧╕ ╒╧╕ ╒╧╕
|財||招||吉||大||閣|
|源||財||祥||吉||家|
|廣||進||如||大||平|
|進||寶||意||利||安|
╘═╛ ╘═╛ ╘═╛ ╘═╛ ╘═╛
今天,我研究了一下Python爬虫的功能——验证码识别
比如某网站有这样一张人机验证的图片
我要用程序识别出验证码是什么,并输入验证码,打开网站,爬取内容。
ddddocr
ddddocr是一款开源库,专门用来识别验证码,方便快捷
安装
终端运行:pip install ddddocr
使用
ddddocr接收这几个参数
| 参数名 | 默认值 | 说明 |
|---|---|---|
| use_gpu | False | Bool 是否使用gpu进行推理,如果该值为False则device_id不生效 |
| device_id | 0 | int cuda设备号,目前仅支持单张显卡 |
classification
| 参数名 | 默认值 | 说明 |
|---|---|---|
| img | 0 | bytes 图片的bytes格式 |
试一下
在编译器中输入如下代码:
import ddddocr
ocr=ddddocr.DdddOcr(old=True)
with open("1.jpg", 'rb') as f:
image = f.read()
print(ocr.classification(image))
1.jpg是这样的

本文介绍了如何使用ddddocr库识别Python验证码,并展示了去除验证码前广告的方法。还涉及了验证码的标记、源码阅读及模拟登录网站的示例。
最低0.47元/天 解锁文章
104

被折叠的 条评论
为什么被折叠?



