Python验证码识别和生成(5000字详细实例和概念讲解)

原创

已于 2022-05-14 19:27:11 修改 · 2.2k 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#爬虫 #验证码 #python

于 2022-05-14 19:26:44 首次发布

本文介绍了如何使用ddddocr库识别Python验证码，并展示了去除验证码前广告的方法。还涉及了验证码的标记、源码阅读及模拟登录网站的示例。

哈喽O(∩_∩)O

        :.,,.-:*``*:-.,,.-:*``*:

         ╭╧╮ ╭╧╮ ╭╧╮ ╭╧╮

        ║周║║末║║快║║乐║

        └﹏┘└﹏┘└﹏┘└﹏┘

        * * * * * * * * * * * * *

╒╧╕ ╒╧╕ ╒╧╕ ╒╧╕ ╒╧╕

｜財｜｜招｜｜吉｜｜大｜｜閣｜

｜源｜｜財｜｜祥｜｜吉｜｜家｜

｜廣｜｜進｜｜如｜｜大｜｜平｜

｜進｜｜寶｜｜意｜｜利｜｜安｜

╘═╛ ╘═╛ ╘═╛ ╘═╛ ╘═╛

今天，我研究了一下Python爬虫的功能——验证码识别

比如某网站有这样一张人机验证的图片

我要用程序识别出验证码是什么，并输入验证码，打开网站，爬取内容。

ddddocr

ddddocr是一款开源库，专门用来识别验证码，方便快捷

安装

终端运行：pip install ddddocr

使用

ddddocr接收这几个参数

参数名	默认值	说明
use_gpu	False	Bool 是否使用gpu进行推理，如果该值为False则device_id不生效
device_id	0	int cuda设备号，目前仅支持单张显卡

classification

参数名	默认值	说明
img	0	bytes 图片的bytes格式

试一下

在编译器中输入如下代码：

import ddddocr
ocr=ddddocr.DdddOcr(old=True)
with open("1.jpg", 'rb') as f:
    image = f.read()
print(ocr.classification(image))

1.jpg是这样的

最低0.47元/天解锁文章