Tesseract OCR 图片识别
官方链接
1.下载
Tesseract OCR文档说明,也可通过官网,下面位置,点击进入:

Tesseract OCR windows 下载包,界面如下:

我这边下载了64位的

2.安装
安装其余与一般一样,默认即可,特别注意以下要选中文相关,不想装C盘的可以选一下安装路径



3.手动添加环境变量

环境变量入口如下:


不要添加:
系统变量名为(会报错,添加了请删除):
TESSDATA_PREFIX

配了会报错:

4.检测是否安装成功
tesseract

表示设置环境变量成功。
tesseract D:\img.jpg D:\test –l chi_sim+eng
(chi_sim是中文识别包,equ是数学公式包,eng是英文包)
示例表示:把d盘下img.jpg图片识别结果,输出至d盘的test文本

不要写代码的话,已经成功了,用命令行也能直接用。。。
5.python代码实现
vscode下载库
前提:python环境是3.9的
-m pip install pytesseract
-m pip install Pillow

以下是系统命令(选择性执行)
python -m pip install pytesseract
python -m pip install Pillow

卸载包
python -m pip uninstall pytesseract
python -m pip uninstall Pillow

删除环境
conda remove -n test37 --all

有疑问
微信小程序联系客服,及时沟通

扫描公众号,了解更多实例分享:

本文介绍了如何下载并安装Tesseract OCR,重点讲解了手动添加环境变量、检测安装及成功标志、以及在Python中使用pytesseract库进行图片识别的步骤。还提供了微信小程序客服支持和相关资源链接。
1015

被折叠的 条评论
为什么被折叠?



