Python本地搭建Tesseract，简单识别图片文本内容

最新推荐文章于 2025-11-09 20:49:45 发布

原创

最新推荐文章于 2025-11-09 20:49:45 发布 · 902 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #Tesseract #OCR #图像识别

本文介绍了如何在Python环境下配置Tesseract OCR，包括安装Python依赖、Tesseract-OCR，解决安装过程中可能出现的问题，如环境变量设置，以及如何处理识别错误。通过指定环境变量和代码调整，确保Python能正确调用OCR引擎识别图片中的文本。

Python本地搭建Tesseract，简单识别图片文本内容

1.首先python版本要是3.6以上
2.需要有pillow模块，没有的话用pip安装
3.需要安装pytesseract，没有的话也需要pip安装，pip install pytesseract
4.再者，还需要最重要的tesseract-ocr包，同样，也需要用pip安装，pip install tesseract-ocr

到此，如果tesseract-ocr安装成功，那么基本上也就成功一半了，但，遗憾的是，这一步绝大多数人是安装失败的，最后的报错信息如下。
error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”: http://landinghub.visualstudio.com/visual-cpp-build-tools

这里显然通过pip是安装不了，而且通过装C++环境也太过繁琐，博主我通过强大的度娘给自己找到了一条简单一点的道路，也供大家参照。

通过这个链接https://github.com/tesseract-ocr/tesseract/wiki 大家可以找到自己对应的操作系统的版本，大家常用的windows版本博主我也在这里列出详细的地址，https://github.com/UB-Mannheim/tesseract/wiki 大家可以下载对应的32位或64位版本。

安装好后那么tesseract-ocr包也就好了。windows里默认安装好的路径是C:\Program Files (x86)\Tesseract-OCR
小tips: OCR Optical Character