python3调用OCR识别

本文介绍了如何在Python3中调用OCR识别,包括安装tesseract-ocr,配置环境变量,以及通过pytesseract库进行OCR操作。虽然tesseract的识别率有待提高,但可以考虑使用腾讯AI开放平台的通用OCR服务,它提供了高效且免费的识别方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

可以用工具,需要下载安装tesseract-ocr,地址:https://github.com/tesseract-ocr/tesseract/wiki,找对应版本,还可以从上面找到各种.traineddata,放入tessdata文件夹。设置好环境变量,要新建TESSDATA_PREFIX,值为:D:\Program Files (x86)\Tesseract-OCR,路径是tessdata文件夹的上一层目录。


还要在pytesseract.py(文件地址如:D:\ProgramData\Anaconda3\Lib\site-packages\pytesseract)找到tesseract_cmd设置好路径。如:tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'。

参考:http://www.cnblogs.com/zhongtang/p/5554784.html

代码很简单:

from PIL import Image
import pytesseract
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值