PP文字识别

1,PaddleOCR简介

近日,百度飞桨正式开源了业界最小的超轻量8.6M中英文识别OCR模型套件PaddleOCR,在模型大小、精度和预测速度上,甚至超过了之前一度登上GitHub热榜的chineseocr_lite(5.1k stars),简单场景下OCR效果更是能媲美收费软件。

除了性能优越之外,百度PaddleOCR还是第一个完整支持从训练到部署完整流程的OCR模型套件,而且部署方式多样,覆盖手机端(含IOS、Android Demo)、嵌入式端,大规模数据离线预测,在线服务化预测等。通过多种预测工具组件的支持,百度PaddleOCR能够满足多样化的工业级应用场景。同时其支持自定义训练,用户可以使用自己的数据集Fine-tune以达到更好的效果,大大提高了程序员们训练部署OCR模型和项目落地的效率,最大程度上满足了企业的不同需求。

随着百度PaddleOCR的开源,其在促进OCR行业发展的同时,也正在赋能企业,推动产业智能化发展

2,python使用pp识别表格数据

from paddleocr import PaddleOCR,draw_ocr
import cv2
img= cv2.imread("2.jpg")
ocr=PaddleOCR(use_angle_cls = True,use_gpu= True) #使用CPU预加载,不用GPU
result=ocr.ocr(img,cls=True)
print(result)
#打开图片文件
#打印所有文本信息
for t in result:
    print(t[1][0])

boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
# print(txts)
scores = [line[1][1] for line in result]
im_show = draw_ocr(img, boxes, txts, scores)

# h,w,_= im_show.shape
# print(h,w)
# im_show.resize((w*2, h),Image.ANTIALIAS)
im_show = Image.fromarray(im_show)
#
#
#
im_show.show()
im_show.save('res.jpg')

效果展示:
在这里插入图片描述
可以看出识别效果不佳,这里图片大小为:4763x3368
感觉是因为图片过大而导致的识别效果差,截图出表格部分进行识别
原图:
在这里插入图片描述
识别结果:
在这里插入图片描述
可以看出,识别率大大增加

3,总结

思考:
如何先把表格提取出来,再进行识别?
答案:
使用深度学习技术,先把表格提取出来,再进行全文识别(待实践)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值