8-python库之-pytesseract图片识别

本文介绍了一种通过图片识别获取软件测试数据的方法,利用pyautogui和pytesseract库实现屏幕截图并转换为文本,特别强调了Tesseract-OCR在Windows平台上的安装与配置过程,以及如何提高识别率。

测试的过程想要得到软件上面的测试数据,当时没办法直接获取到,后面找到一个方法就是图片识别,先使用pyautogui截取需要获取数据的地方,然后通过pytesseract将图片上面的文字转化成字符串就成功了

pip install pytesseract

1. 安装Tesseract-OCR

win上面图片识别需要用到Tesseract-OCR工具,所以需要先安装这个软件

先到网址下载,https://sourceforge.net/projects/tesseract-ocr/
安装之后找到tesseract.exe所在的路径路径,后面调用的时候指定

或者直接找pytesseract.py文件,找到 tesseract_cmd,改变它的值为刚才安装 tesseract.exe 的位置

tesseract_cmd = 'D:\\Program Files\\Tesseract-OCR\\tesseract.exe'

但是我觉得这种直接改库内容好像不太好,还是后面传参就去就好了

2. pytesseract使用

pytesseract的使用比较简单,就是调用image_to_string函数

如下:

import pytesseract

# 指定tesseract.exe所在的位置
pytesseract.pytesseract.tesseract_cmd = 'D:\\Program Files\\Tesseract-OCR\\tesseract.exe'

image = Image.open("test.png")
content = pytesseract.image_to_string(image)  # 解析图片
logging.info(content)

image_to_string默认就是只能转换

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Creator_Ly

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值