[Python OCR] pytesseract 的正确使用方式(报错 TesseractNotFoundError)

  • pytesseract的pypi网址
  • 如果直接安装使用会报错:
    1. ocr图片:
      在这里插入图片描述
    2. 简易使用:pip3 install pytesseract
      import pytesseract
      from PIL import Image
      print(pytesseract.image_to_string(Image.open('1.png')))
      
    3. 报错如下:
      pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.
  • 需要安装Google’s Tesseract-OCR Engine
    • To install Tesseract 4.x you can simply run the following command on your Ubuntu 18.xx bionic: sudo apt install tesseract-ocr
  • 正确结果:
    在这里插入图片描述
### 解决 Pytesseract TesseractNotFoundError 错误 当遇到 `pytesseract.TesseractNotFoundError` 错误时,通常是因为 Tesseract OCR正确安装或其路径未被 Python 正确识别。以下是详细的解决方案: #### 安装 Tesseract OCR 应用程序 确保已下载并安装最新版本的 Tesseract OCR 软件[^1]。 对于 Windows 用户来说,可以从官方 GitHub 页面获取适用于操作系统的安装包,并按照说明完成安装过程[^5]。 #### 配置环境变量 为了使操作系统能够全局访问 Tesseract 命令行工具,在安装完成后需设置系统环境变量 PATH 中加入 Tesseract 的可执行文件目录位置[^2]。 例如,如果 Tesseract 安装于默认路径,则应向 PATH 添加如下条目: ```plaintext C:\Program Files\Tesseract-OCR\ ``` #### 修改 pyteseract.py 文件中的 tesseract_cmd 变量 另一种方法是在项目中直接指定 Tesseract 执行文件的具体路径。这可以通过编辑 `site-packages/pytesseract/pytesseract.py` 文件来实现,将其中定义的 `tesseract_cmd` 字符串替换为实际安装路径下的完整 .exe 文件名[^3]。 具体做法可以参照下面的例子: ```python import pytesseract from PIL import Image # 设置 tessarct_executable_path 为你自己的 Tesseract 安装路径 pytesseract.pytesseract.tesseract_cmd = r'D:\Program Files (x86)\Tesseract-OCR\tesseract.exe' image = Image.open('example.png') text = pytesseract.image_to_string(image) print(text) ``` 通过上述任一方式都可以有效解决因缺少 Tesseract 导致的错误提示问题[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值