文章目录
🌟介绍一波
Tesseract-OCR 是一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎。与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。
(别问我咋知道,百度一下,你就知道😛)
🌟小安装
- 安装Tesseract-OCR(64位的安装包链接)
tesseract-ocr-setup-4.00.00dev.exe - tesseract各种语言集合包
tesseract各种语言集合包
🌟配置环境变量
⭐️tesseract-ocr配置
-
下载 tesseract-ocr-setup-4.00.00dev.exe 完成后,对tesseract-ocr进行安装,找到tesseract.exe所在的文件路径,复制该文件所在的路径。

-
打开环境变

本文介绍了Tesseract-OCR的安装、环境变量配置和语言包设置,通过CMD命令行及PyCharm实现图片识别。遇到识别精度低的问题,可考虑训练库或采用更专业的解决方案。
最低0.47元/天 解锁文章
6131





