1,PaddleOCR简介
近日,百度飞桨正式开源了业界最小的超轻量8.6M中英文识别OCR模型套件PaddleOCR,在模型大小、精度和预测速度上,甚至超过了之前一度登上GitHub热榜的chineseocr_lite(5.1k stars),简单场景下OCR效果更是能媲美收费软件。
除了性能优越之外,百度PaddleOCR还是第一个完整支持从训练到部署完整流程的OCR模型套件,而且部署方式多样,覆盖手机端(含IOS、Android Demo)、嵌入式端,大规模数据离线预测,在线服务化预测等。通过多种预测工具组件的支持,百度PaddleOCR能够满足多样化的工业级应用场景。同时其支持自定义训练,用户可以使用自己的数据集Fine-tune以达到更好的效果,大大提高了程序员们训练部署OCR模型和项目落地的效率,最大程度上满足了企业的不同需求。
随着百度PaddleOCR的开源,其在促进OCR行业发展的同时,也正在赋能企业,推动产业智能化发展
2,python使用pp识别表格数据
from paddleocr import PaddleOCR,draw_ocr
import cv2
img= cv2.imread("2.jpg")
ocr=PaddleOCR(use_angle_cls = True,use_gpu= True) #使用CPU预加载,不用GPU
result=ocr.ocr(img,cls=True)
print(result)
#打开图片文件
#打印所有文本信息
for t in result:
print(t[1][0])
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
# print(txts)
scores = [line[1][1] for line in result]
im_show = draw_ocr(img, boxes, txts, scores)
# h,w,_= im_show.shape
# print(h,w)
# im_show.resize((w*2, h),Image.ANTIALIAS)
im_show = Image.fromarray(im_show)
#
#
#
im_show.show()
im_show.save('res.jpg')
效果展示:
可以看出识别效果不佳,这里图片大小为:4763x3368
感觉是因为图片过大而导致的识别效果差,截图出表格部分进行识别
原图:
识别结果:
可以看出,识别率大大增加
3,总结
思考:
如何先把表格提取出来,再进行识别?
答案:
使用深度学习技术,先把表格提取出来,再进行全文识别(待实践)