Tesseract图形识别软件的安装

本文介绍如何在Windows环境下正确安装并配置Tesseract OCR,包括解决环境变量配置问题和语言包路径错误等常见问题,并提供了一个简单的验证码识别示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

安装

下载安装: tesseract

安装 pytesseractPillow

pip install pytesseract

pip install Pillow

这里只说 winsows 系统下的安装,linux 基本不会有什么问题。
在利用 pytesseract 调用 tesseract 时遇到以下错误:

FileNotFoundError: [WinError 2] 系统找不到指定的文件。

于是我看了下pytesseract源码,发现有这样的一行

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

tesseract_cmd = 'tesseract'

估计 windows 系统要手工添加环境变量,所以才产生的问题,于是又将 tesseract 添加到环境变量 Path 中,但还是会报错:

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\eng.traineddata')

这个是eng.traineddata文件路径有误才会出现的错误。

解决办法:

先查看tesseract有没有这个语言包,有CMD中输入命令:

tesseract --list-langs

结果:

List of available languages (2):
eng
osd

然后再查看然后再google搜索一下问题,发现还是 tesseract 的环境变量的问题,找到了下面这一句话

Please make sure the TESSDATA_PREFIX environment variableisset to the
parent directory of your"tessdata"directory.

于是新建的一个TESSDATA_PREFIX变量,指定tessdata的上级目录也就是C:\Program Files (x86)\Tesseract-OCR

图片描述

安装完成。

先用一个简单的验证码测试一下:

图片描述

from PIL import Image
import pytesseract
result = pytesseract.image_to_string(Image.open(r'F:\PIN_ws\692.jpg',"r"), lang='eng') 
print(result)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值