文本的检测、识别实战：使用 Tesseract 进行 OpenCV OCR 和文本识别

最新推荐文章于 2025-04-11 14:49:56 发布

2401_83703835

最新推荐文章于 2025-04-11 14:49:56 发布

阅读量1.3k

点赞数 19

分类专栏：程序员文章标签： opencv ocr 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/2401_83703835/article/details/137617440

版权

本文介绍如何结合OpenCV的EAST文本检测器和Tesseract进行OCR。首先，通过EAST检测图像中的文本区域，然后用Tesseract进行识别。在Ubuntu、macOS和Win10上分别介绍了Tesseract的安装方法。最后，讨论了OCR过程中的关键参数，如--oem和--psm，并提供了项目结构和实现OpenCV OCR算法的代码概述。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一旦我们使用 OpenCV 检测到文本区域，我们将提取每个文本 ROI 并将它们传递到 Tesseract，使我们能够构建完整的 OpenCV OCR 管道！
最后，我将通过向您展示使用 OpenCV 应用文本识别的一些示例结果来结束今天的教程，并讨论该方法的一些局限性和缺点。

让我们继续开始使用 OpenCV OCR！

如何安装Tesseract 4

==========================================================================

在 Ubuntu 上安装 Tesseract 4

根据您使用的是 Ubuntu 18.04 还是 Ubuntu 17.04 及更早版本，用于在 Ubuntu 上安装 Tesseract 4 的确切命令会有所不同。

要检查您的 Ubuntu 版本，您可以使用 lsb_release 命令：

lsb_release -a

如您所见，我正在运行 Ubuntu 18.04，但您应该在继续之前检查您的 Ubuntu 版本。

对于 Ubuntu 18.04 用户，Tesseract 4 是主 apt-get 存储库的一部分，通过以下命令安装 Tesseract 变得非常容易：

sudo apt install tesseract-ocr

在 macOS 上安装 Tesseract 4

如果您的系统上安装了 Homebrew，macOS 的“非官方”软件包管理器，那么在 macOS 上安装 Tesseract 很简单。只需运行以下命令，Tesseract v4 就会安装在您的 Mac 上：

brew install tesseract

如果您已经在 Mac 上安装了 Tesseract（例如，如果您遵循了我之前的 Tesseract 安装教程），您首先要取消原始安装的链接：

brew unlink tesseract

在 Win10上安装 Tesseract 4

初识OCR，Tesseract的安装与使用_AI浩-优快云博客

然后你可以运行安装命令。

验证您的 Tesseract 版本

一旦你在你的机器上安装了 Tesseract，你应该执行以下命令来验证你的 Tesseract 版本：

tesseract -v

只要您在输出中的某处看到 tesseract 4，您就知道您的系统上安装了最新版本的 Tesseract。

然后，我们将使用 pip 安装 Pillow，这是一个对 Python 更友好的 PIL 版本，然后是 pytesseract 和 imutils：

$ pip install pillow

$ pip install pytesseract

$ pip install imutils

了解 OpenCV OCR 和 Tesseract 文本识别

=========================================================================================

现在我们已经在我们的系统上成功安装了 OpenCV 和 Tesseract，我们需要简要回顾一下我们的管道和相关命令。

首先，我们将应用 OpenCV 的 EAST 文本检测器来检测图像中文本的存在。

EAST 文本检测器将为我们提供文本 ROI 的边界框 (x, y) 坐标。

我们将提取这些 ROI 中的每一个，然后将它们传递给 Tesseract v4 的 LSTM 深度学习文本识别算法。 LSTM 的输出将为我们提供实际的 OCR 结果。

最后，我们将在输出图像上绘制 OpenCV OCR 结果。但在我们真正开始我们的项目之前，让我们简要回顾一下 Tesseract 命令（它将被 pytesseract 库在后台调用）。

在调用 tessarct 二进制文件时，我们需要提供许多标志。三个最重要的是 -l 、 --oem 和 --psm 。

-l 标志控制输入文本的语言。我们将在此示例中使用 eng（英语），但您可以在此处查看 Tesseract 支持的所有语言。

–oem 参数或 OCR 引擎模

最低0.47元/天解锁文章

博客等级

码龄1年

450
原创

6222
点赞

6380
收藏

4550
粉丝

关注

私信

热门文章

分类专栏

程序员 450篇

展开全部收起

上一篇：: 手把手教你用Python爬取某宝男装信息，文末附完整代码！

下一篇：: 用 Python 写的文档批量翻译工具，效果竟然超越付费软件？

最新评论

python使用celery异常
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1)整个项目目录结构, 2）@task入参 ,3）celery的配置，4）celery的配置 include ,5）cmd命令行启动参数 --queues= 的值,6）用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/ ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。 funboot能支持celery作为中间件，用户可以使用funboost的极简api来使用celery核心调度，不用手动复杂的配置操作celery funboost 自动化操作celery https://github.com/ydf0509/funboost_support_celery_demo pip install funboost
那些 Android 程序员必会的视图优化策略(1)
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
iotdb分段分组聚合_iotdb 聚合统计
Mario far: tags 看起来像是 kv格式的备注, 减少关联查询使用的感觉
【kafka运维】Leader重新选举运维脚本(1)
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。