安装包及替换文件
链接:https://pan.baidu.com/s/1gOVV6_MfXBdACKLqyQjR9Q
提取码:xxza
复制这段内容后打开百度网盘手机App,操作更方便哦
安装步骤:
https://blog.youkuaiyun.com/showgea/article/details/82656515
安装后进行测试
tesseract test.png stdout --psm 13 --oem 0 makebox
不能用就替换
替换到安装文件下的tessdata下
分割线——————————————————————————————————————————————————————————————————————————————————————————————————
重新记录一下win下的tesseract安装过程
注意:要是需要中文的话,需要在安装的过程中选一下下载chinese的data
pip install opencv-python
pip install pytesseract
#下载Tesseract-OCR 5.0.0-alpha.20201127安装包并安装!然后在环境变量中添加
#C:\Program Files\Tesseract-OCR
#下载地址:
#https://digi.bib.uni-mannheim.de/tesseract/
测试一下:
import pytesseract as tess
print(tess.get_tesseract_version())
print(tess.get_languages())
#5.0.0-alpha.20201127
#['chi_sim', 'chi_sim_vert', 'eng', 'osd']
这里可能会遇到一个问题:
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.
这个问题是环境变量,虽然添加了,但是还需要在代码里改一下:
#D:\sofeware\Anaconda3\envs\Tesseract\Lib\site-packages\pytesseract
#这是我的pytesseract安装路径,注意我这里创建了一个环境(Tesseract),反正就是找到安装路径,找到pytesseract.py
找到下面这句
# tesseract_cmd = 'tesseract'#(原本的)
tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'(修改后的)
然后再重新运行一下上面的测试代码。
https://mp.weixin.qq.com/s/Nvs0m4NhNOnLA8B7N29-rg