一、前言
在进行自动化测试的过程中,ocr
文字识别一直是大家最想要实现以及最需要的能力,今天就来介绍一个由百度飞浆提供的一个免费的ocr
识别库——PaddleOCR
,以及探讨一下,PaddleOCR
与Airtest
协作能擦出怎么样的火花~
二、PaddleOCR介绍
PaddleOCR
是百度飞浆AI研发的一个ocr
工具库,目前支持多种目标识别,更多的介绍可以戳官方项目去看看:https://github.com/PaddlePaddle/PaddleOCR,我们今天来讲讲,在与Airtest协作中,我们可能会用到PaddleOCR
的什么功能。
在使用PaddleOCR
之前,需要在自己的本地环境中安装对应的PaddleOCR
库,方便我们后续调用。我们建议是安装到本地的python环境内,后续将AirtestIDE的python环境更换为本地python环境即可。
#安装PaddlePaddle
pip install paddlepaddle
#安装PaddleOCR whl包
pip install paddleocr
在开始使用之前,我们来了解一下PaddleOCR
识别的效果以及返回的情况,PaddleOCR
主要是通过我们传入需要识别的图片,通过调用PaddleOCR
模型库,去进行识别并返回识别结果或识别后的图片,例如下图这样:
通过PaddleOCR
识别打印文字信息如下,分别以列表的形式返回了所识别到的文字的左上角坐标、右上角坐标、右下角坐标、左下角坐标、识别到的文字以及识别置信度:
[[[154.0, 9.0], [492.0, 9.0], [492.0, 33.0], [154.0, 33.0]], ('小学数学第八册第三单元测试题', 0.9987085461616516)]
[[[238.0, 47.0], [319.0, 47.0], [319.0, 66.0], [238.0, 66.0]], ('(小数乘法)', 0.9819607138633728)]
[[[109.0, 80.0], [160.0, 80.0], [160.0, 103.0], [109.0, 103.0]], ('姓名:', 0.9986250996589661)]
[[[305.0