测试的过程想要得到软件上面的测试数据,当时没办法直接获取到,后面找到一个方法就是图片识别,先使用pyautogui截取需要获取数据的地方,然后通过pytesseract将图片上面的文字转化成字符串就成功了
pip install pytesseract
1. 安装Tesseract-OCR
win上面图片识别需要用到Tesseract-OCR工具,所以需要先安装这个软件
先到网址下载,https://sourceforge.net/projects/tesseract-ocr/
安装之后找到tesseract.exe所在的路径路径,后面调用的时候指定
或者直接找pytesseract.py文件,找到 tesseract_cmd,改变它的值为刚才安装 tesseract.exe 的位置
tesseract_cmd = 'D:\\Program Files\\Tesseract-OCR\\tesseract.exe'
但是我觉得这种直接改库内容好像不太好,还是后面传参就去就好了
2. pytesseract使用
pytesseract的使用比较简单,就是调用image_to_string函数
如下:
import pytesseract
# 指定tesseract.exe所在的位置
pytesseract.pytesseract.tesseract_cmd = 'D:\\Program Files\\Tesseract-OCR\\tesseract.exe'
image = Image.open("test.png")
content = pytesseract.image_to_string(image) # 解析图片
logging.info(content)
image_to_string默认就是只能转换

本文介绍了一种通过图片识别获取软件测试数据的方法,利用pyautogui和pytesseract库实现屏幕截图并转换为文本,特别强调了Tesseract-OCR在Windows平台上的安装与配置过程,以及如何提高识别率。
最低0.47元/天 解锁文章
3698

被折叠的 条评论
为什么被折叠?



