windows下配置python + pytesseract环境

本文介绍了在Windows操作系统下配置Python和pytesseract库进行图形验证码识别的详细步骤,包括安装Python、pip,安装pillow和pytesseract模块,下载并配置tessearct-ocr.exe,修改pytesseract.py源码指定tesseract命令路径,以及解决运行时缺少traineddata文件的错误,通过设置config参数指向tessdata路径。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

pytesseract可以用来进行简单的图形验证码识别,很方便。在windows下的配置需要花些功夫,完整配置方法如下:

1、安装python、pip
2、安装 pillow、pytesseract模块:
pip install pillow
pip install pytesseract
3、下载tessearct-ocr.exe文件,并安装
4、安装完毕后,修改pytesseract.py源码:
找到 tesseract_cmd=”tesseract”这一行,将后面的tesseract改为tessearct-ocr.exe在本机的安装目录,如:c:\Program Files (x86)\Tesseract-OCR\tesseract.exe。
5、此时如果在代码中运行

text = pytesseract.image_to_string(img)

会报错:pytesseract.pytesseract.TesseractError: (1, ‘Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/chi_sim.traineddata’)
解决方法,调用时在后面加上config参数,内容为你的tessdata所在路径即可:


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值