【Python使用pytesseract时无法识别指定文件】——解决方案详解
Python是目前最热门的编程语言之一,在图像处理领域,常常使用到pytesseract库来进行OCR识别。但是,在使用pytesseract进行OCR识别时,有时候会遇到错误提示:“[WinError 2] 系统找不到指定的文件”。这个错误提示在初学者中比较常见,它的原因是在使用pytesseract时没有指定tesseract.exe的路径。
下面我们将详细介绍三种解决方案,帮助大家解决这个问题。
方案一:安装tesseract-ocr
在使用pytesseract之前,必须先安装tesseract-ocr(开源OCR引擎),因为pytesseract是基于tesseract-ocr的封装,如果没有tesseract-ocr,pytesseract是无法正常工作的。
官网下载地址:https://github.com/tesseract-ocr/tesseract/releases
下载并安装好tesseract-ocr之后,需要在系统环境变量Path中添加tesseract的安装路径。方法如下:
-
打开“我的电脑”,右键点击“属性”。
-
点击系统“高级系统设置”。
-
点击“环境变量”。
-
在“系统变量”中找到“Path”并点击“编辑”。
-
在“变量值”中添加tesseract-ocr的安装路径,例如:D:\Program Files\Tesseract-OC