使用PaddleOCR处理验证码

Link2Points

已于 2024-12-19 23:12:07 修改

阅读量226

点赞数 1

CC 4.0 BY-SA版权

分类专栏：工作日志（三） # Python 文章标签： python

于 2024-10-24 19:15:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Link2Points/article/details/142886890

Python 同时被 2 个专栏收录

6 篇文章

订阅专栏

工作日志（三）

1 篇文章

订阅专栏

安装过程略

图像识别

from paddleocr import PaddleOCR
from PIL import Image, ImageOps

thrd1, thrd2, cnt1mx, cnt2mx = 150, 245, 5, 4

img = Image.open(r"./VCode/1.jpg").convert('L')
img = ImageOps.invert(img.point(lambda p: p < thrd1 and 255))

width, height = img.size
px = img.load()
px = img.load()
for x in width:
    for y in range(height):
        cnt1 = cnt2 = 0
        neighbors = [
            (0, 0), (0, 1), (0, -1), (1, 0), (-1, 0),
            (1, -1), (-1, 1), (-1, -1), (1, 1)
        ]
        for dx, dy in neighbors:
            if 0 <= x + dx < width and 0 <= y + dy < height:
                if px[x + dx, y + dy] > thrd2:
                    cnt1 += 1
                else:
                    cnt2 += 2
        if cnt1 > cnt1mx:
            px[x, y] = 0
        elif cnt2 > cnt2mx:
            px[x, y] = 255
img.save(r"./VCode/temp.jpg")

po = PaddleOCR(user_angle_cls=True, use_space_char=False, max_text_length=4, lang="en", det_max_side_len=100, det_db_score_mode="slow", det_db_unclip_ratio=3)
res = po.ocr(r"./VCode/temp.jpg", cls=True)
if res != None:
	for code in res:
    	print(code)

文档识别

from PIL import Image
from paddleocr import PaddleOCR
po = PaddleOCR(use_angle_cls=True, lang="en")
res = po.ocr(r"./doc/1.pdf", cls=True)
for idx in range(len(res)):
	page = res[idx]
	if res == None:
		continue
	for ctx in page:
		print(ctx)

博客等级

码龄5年

77
原创

294
点赞

1376
收藏

147
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: C语言数据结构编写练习

最新评论

使用PaddleOCR处理验证码
优快云-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/mysql?utm_source=AI_act_mysql
使用PaddleOCR处理验证码
优快云-Ada助手: 推荐 MySQL入门技能树：https://edu.youkuaiyun.com/skill/mysql?utm_source=AI_act_mysql
STM32 SPI读DW1000的Device_ID的问题与解决
Link2Points: 我记得当时的需求是一发一收，通过修改官方提供的Demo是可以实现的，比如发送端调用官方封装好的方法写入hello，接受端同样调用封装好的方法可读出hello（虽然会丢包）。我是没有遇到写入出现的问题。
STM32 SPI读DW1000的Device_ID的问题与解决
Dmuskmelon: 所以现在就是添加延时，修改函数的参数就解决了？？？现在我这能读到id，spi读取是没问题的，但是写入还存在问题，不知道是为啥，0x21读取到的也是id相关的内容,说明根本没有写进去，问题出在哪呢？
C++ bmp图像添加水印及旋转水印
Link2Points: 文章内容是部分核心代码，读取水印原图等功能的代码没有展示，因固盘损坏源工程已丢失且没有备份，大致记得完整的功能是读取水印原图记录判断记录边界点，将记录的边界点应用在需要处理的图片上。但存在缺陷，旋转水印存在部分像素点失真，如果要进阶的话可用雅可比矩阵处理。最简单的处理办法，是对需处理图片选定像素点位置集合，进行涂色。

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。