8-python库之-pytesseract图片识别

最新推荐文章于 2025-07-24 11:26:42 发布

原创

最新推荐文章于 2025-07-24 11:26:42 发布 · 926 阅读

3 ·

CC 4.0 BY-SA版权

本文介绍了一种通过图片识别获取软件测试数据的方法，利用pyautogui和pytesseract库实现屏幕截图并转换为文本，特别强调了Tesseract-OCR在Windows平台上的安装与配置过程，以及如何提高识别率。

测试的过程想要得到软件上面的测试数据，当时没办法直接获取到，后面找到一个方法就是图片识别，先使用pyautogui截取需要获取数据的地方，然后通过pytesseract将图片上面的文字转化成字符串就成功了

pip install pytesseract

1. 安装Tesseract-OCR

win上面图片识别需要用到Tesseract-OCR工具，所以需要先安装这个软件

先到网址下载，https://sourceforge.net/projects/tesseract-ocr/
安装之后找到tesseract.exe所在的路径路径，后面调用的时候指定

或者直接找pytesseract.py文件，找到 tesseract_cmd，改变它的值为刚才安装 tesseract.exe 的位置

tesseract_cmd = 'D:\\Program Files\\Tesseract-OCR\\tesseract.exe'

但是我觉得这种直接改库内容好像不太好，还是后面传参就去就好了

2. pytesseract使用

pytesseract的使用比较简单，就是调用image_to_string函数

如下：

import pytesseract

# 指定tesseract.exe所在的位置
pytesseract.pytesseract.tesseract_cmd = 'D:\\Program Files\\Tesseract-OCR\\tesseract.exe'

image = Image.open("test.png")
content = pytesseract.image_to_string(image)  # 解析图片
logging.info(content)

image_to_string默认就是只能转换