【python文字识别OCR】

最新推荐文章于 2025-05-03 09:07:35 发布

失败者莉

最新推荐文章于 2025-05-03 09:07:35 发布

阅读量817

点赞数

分类专栏： Python 文章标签： python 开发语言深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/z3119101224/article/details/126960601

版权

这篇博客介绍了如何利用tesseract-OCR在Python环境下进行文字识别。首先，需要下载并安装tesseract-OCR的exe文件，特别强调在安装过程中要选择中文语言包。接着，通过pip安装必要的Python包pytesseract和Pillow。最后，提到了在识别中文时可能遇到的问题以及提高识别准确率的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题

python实现文字识别

方法

tesseract-OCR方法，没有环境限制，pytorch还是tensorflow都可以用

步骤

1. 下载 tesseract-ocr 的exe文件

文件名称：tesseract-ocr-w64-setup-v4.1.0.20190314.exe（根据自己电脑位数下载）
链接：https://digi.bib.uni-mannheim.de/tesseract/

2. 双击安装 tesseract-ocr.exe 文件

中途安装需要在select components时，add language （最后一行小加号）中选中所有Chinese开头的四个中文包，然后一直点击确认安装

3. 安装需要的包

在python环境中安装两个包：
pip install pytesseract
pip install Pillow

4.识别代码

import pytesseract as pt
from PIL import Image

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。