要想使用pytesseract,首先安装tesseract:
https://digi.bib.uni-mannheim.de/tesseract/
下载一个tesseract.exe(dev为测试版,其他为稳定版)
安装的时候可选择安装支持的识别语言包,但语言包不要选太多,否则会很慢:
加环境变量:
我的是:D:\ocr\OcrInstall\Tesseract-OCR
简单使用:
#先cd到图片目录下(result后不用加txt,tesseract默认自动添加)
D:\ocr>tesseract newpath.png result
Tesseract Open Source OCR Engine v4.0.0.20190314 with Leptonica
Warning: Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 141