基于PaddleOCR的图像文字识别与程序打包方法

原创

于 2025-02-10 22:04:36 发布 · 1.4k 阅读

·

14

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #深度学习 #python #ocr #计算机视觉

目录

一、基本介绍

二、程序实现

1）环境配置

2）代码实现

3）程序运行结果

三、程序打包

1）使用pyinstaller打包程序

2）添加依赖和模型数据

四、需要注意的问题

一、基本介绍

本文主要介绍利用现有开源的图像文字识别（OCR）库，开发一个简单的程序，用于识别图像中的文字信息。当前，开源的OCR库有很多，比如国外的Tesseract、EasyOCR，国内百度、阿里、腾讯等均提供了相应的开源工具包。百度的PaddleOCR在中文识别上准确率很高，百度开发的paddleocr库也为人工智能开发提供了各类算法模型，在人工智能开发领域运用比较广泛。本文基于PaddleOCR，在python中利用百度已经训练好的OCR模型库，完成对图像中文字识别，并将开发程序打包，使其可移植到其他电脑终端使用。

二、程序实现

1）环境配置

（1）新建工程

python程序开发使用的IDE工具是pyChram2023.1.21版，直接新建一个纯python项目，并新构建一个虚拟环境，基本设置如下，工程路径可自定义。

（2）安装依赖包

使用PaddleOCR需要安装两个依赖包，分别是paddlepaddle和paddleocr。这两个依赖包均安装在上一步建立的虚拟环境下（venv_WZSB）。需要注意的是，paddleocr目前只支持到python3.8到python3.11版本，若使用的python版本不在此区间，需要安装一个在此区间的版本，并将当前python解释器设置为此可用的版本，否则paddleocr将安装失败。

2）代码实现

使用python编写一个简易的窗口程序，用于加载显示需要识别的图片，并将识别的结果显示在窗口中。

（1）设置模型存放路径

首先在代码中设置paddleocr训练模型的存放路径，代码如下。由于我们使用百度工程师已经训练好的模型，所以我们不用再编写具体的文字识别模型，直接使用即可。下面的代码分别表明了检测、识别

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

琳琳简单点 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。