基于百度paddle的快递面单三段码识别

基于百度paddle的快递面单三段码识别

写这篇文章的目的是为了填补一个行业中对深度学习使用的空白,我在网上也搜索过识别快递单三段码对应的文章,但是大都不全面,有的也是基于opencv+Tesseract-OCR的,在深度学习中缺少对应的实例。出于对技术的热爱,对开源的期望我把自己研究的成果开源到GitHub,代码地址在文章最后,接下来我大体介绍一下项目处理图像的流程思路,识别注意事项。代码如果对大家有帮助请start下。
在这里插入图片描述
我处理的是龙门架中相机拍的图片(== 因为涉及个人隐私,这里图片我做了处理,大家测试需要用合法途径得到的图片 ==),所以需要进行抠图操作,这一步我用的是paddleDetection进行的图片检测
在这里插入图片描述

然后进行裁剪操作
![在这里插入图片描述](https://img-blog.csdnimg.cn/img_convert/18e9f032fe18bdba6591feaf18ed5e6f.png

在进行霍夫直线探测,矫正倾斜的图片

在这里插入图片描述
矫正后会出现卧倒的图片,这样对我们的识别会产生字符顺序上的歧义,如下图
在这里插入图片描述
我在这里进行一次文本框探测,将所有的有x+w , y+h的边相加如果 (x+w)>(y+h)能判定是卧倒的图片,需要进行 -+90度操作,计算方式如下:
在这里插入图片描述
再次用paddleDetection检测三段码的位置进行裁剪操作,这时裁剪下的三段码图片有倒置的,这里咱们只看这个7,如下图:
在这里插入图片描述
像这样的图片就需要进行+180度旋转图片操作,旋转之前我们需要知道这个图片文字的角度,这里我使用paddleOCR的方向分类器进行预测(https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.1/doc/doc_ch/whl.md 搜索:方向分类器)
接下来就是识别,对于三段码特殊的文本结构我使用了空格检测,最终识别结果如下:

xxx xxx-x-x xx xx

希望对大家在从获取面单到拿到三段码截图整体流程上有一定帮助,谢谢大家。

可以加微信交流:15254042250 手机同号。

参考文章
https://blog.youkuaiyun.com/IT_BOY__/article/details/93632321

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

全栈攻城狮s

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值