Windows10下使用PaddleOCR+Python

原创

已于 2022-10-10 17:52:17 修改 · 1.6k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #paddlepaddle #ocr #python

于 2021-06-30 11:44:41 首次发布

本文详细介绍了如何在Windows10环境下搭建PaddleOCR文字识别系统，包括安装CUDA、配置Python环境、创建虚拟环境、安装PaddlePaddle等步骤，并解决了常见错误。

文章目录

Windows10下使用PaddleOCR+Python

Windows10下使用PaddleOCR+Python

1.1 Windows下查看CUDA版本

1.1.1 找到NVIDIA控制面板

在控制面板中找到

右键找到

1.1.2 点击NVIDIA控制面板的帮助，点击左下角系统信息

1.1.3 在这里

1.2 安装python环境

1.2.1 安装Miniconda

下载安装包安装即可

</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一路前行，幸运相伴

关注关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

使用 Python+PaddleOCR 实现图文识别：从入门到精通

爱搬砖的程序猿

02-17

4654

在当今数字化时代，图文识别技术的应用越来越广泛，如文档数字化、信息提取等。PaddleOCR 是百度开源的一款强大的 OCR 工具包，它集成了多种先进的算法和模型，能够高效准确地进行图文识别。本文将详细介绍如何使用 PaddleOCR 和 Python 实现图文识别，并给出具体的代码和步骤。

PaddleOcr文字识别的Python部署方法

飞得更高肥尾沙鼠

04-16

4405

@[TOC](PaddleOcr的Python部署攻略) ## 方法一： 1 安装anaconda个人版； 2 打开Anaconda Prompt； 3创建环境：在命令行输入 ```python conda create --name paddle_env python=3.8 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ ``` 创建名为paddle_env的环境。 4 激活环境：在命令行输入 ```p

参与评论您还未登录，请先登录后发表或查看评论

榜单第一！PaddleOCR-VL多模态文档解析王者本地部署实战指南

最新发布

fufan_LLM的博客

10-24

3938

PaddleOCR-VL是百度推出的多模态文档解析模型，采用视觉-语言模型架构，在文档解析任务中表现优异。本教程详细介绍了其本地部署流程，包括硬件要求、环境准备、PaddlePaddle框架安装、模型下载与验证等关键步骤。该系统通过两阶段工作流程（布局分析和元素识别）实现高效文档解析，支持输出结构化Markdown或JSON格式。部署测试表明，该方案在A100 GPU上能达到1.22页/秒的吞吐量，比同类方案快15.8%，显存占用减少40%。教程提供了完整的代码示例和注意事项，适合开发者快速实现本地部署。

paddleocr +python3.8.5 简单安装部署调试（windows）

weixin_47764730的博客

02-24

3044

paddleocr +python3.8.5 简单安装部署调试（windows）1、paddleocr体验及下载2、部署准备3、python环境准备4、paddleocr代码下载5、部署完成 1、paddleocr体验及下载 1、PaddleHub提供了PaddleOCR代码下载地址：https://github.com/PaddlePaddle/PaddleOCR/tree/dygraph 2、在线体验地址： https://www.paddlepaddle.org.cn/hub/scene/ocr 2、

【Python】paddleocr快速使用及参数详解

Elaine的博客

01-26

2万+

在使用PaddleOCR进行模型推理时，可以自定义修改参数，来修改模型、数据、预处理、后处理等内容

paddleocr快速入门：基于python脚本及命令行两种方式实现图片OCR识别

jiabiao1602的专栏

06-02

7242

paddleocr快速入门：基于python脚本及命令行两种方式实现图片OCR识别。

Windows10下使用PaddleOCR+c++

ShareProgress的博客

06-30

8328

文章目录Windows10下使用PaddleOCR+c++2.1 配置c++环境2.1.1 cmake2.1.2 OpenCV2.1.3 vs20172.1.4 PaddleOCR 项目文件2.1.5 paddle推理预测库2.1.6 模型文件2.2 生成编译例程——ocr_system2.2.1 cmake生成工程2.2.2 使用vs2017编译2.2.3 编译报错2.3 运行demo程序2.3.1 修改配置文件2.3.2 运行程序：2.3.3 解决Windows下控制台输出中文乱码 Windows10下

PaddleOCR+python+win10安装使用

Rena的博客

06-24

6401

这里写自定义目录标题欢迎使用Markdown编辑器1. 安装PaddlePaddle2 安装shapely包2.1 下载shapely安装包2.2 安装shapely包3 下载项目代码及模型3.1 下载项目代码3.2 下载inference模型等模型解压，正常解压结果并不是官网结果，需要通过Git进行解压 tar xf ch_ppocr_mobile_v1.1_cls_infer.tar tar xf ch_ppocr_mobile_v1.1_det_infer.tar tar xf ch_ppocr_m

让OCR更简单 _ PaddleOCR+OpenCV实现文字识别步骤与代码演示1

08-03

在Windows 10环境下，下载如下三个模型文件；对于移动端，下载另外三个模型文件。安装完成后，可以开始进行代码演示。以下是一个基本的文字识别示例： ```python import cv2 import numpy as np from PIL import ...

Python使用PaddleOCR进行图片转文字

wozuishuai_的博客

03-22

1948

PaddleOCR是百度飞桨开发的OCR库。

paddleocr:python脚本使用

静谧、淡雅

01-13

3976

文档地址： https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.4/doc/doc_ch/whl.md 1 检测+识别代码： from paddleocr import PaddleOCR, draw_ocr from PIL import Image def my_ocr(img_path): # need to run only once to download and load model into memory #

OCR版面分析-- PaddleOCR（python 文档解析提取）

消极的人永远是对的，积极的人选择勇往直前

05-16

6366

当内置模型无法满足需求时，需要使用到自己训练的模型。首先，参照模型导出将检测、分类和识别模型转换为inference模型，然后按照如下方式使用。

python图像识别 - paddleocr (小白安利款)

老鹰的博客

11-10

2万+

前言之前我有记载过，关于Python的图像识别的文章，但是识别率不高且不够灵活，实用性不强，所以不怎么推荐最近发现一个新的Python写好的的轮子--paddleocr，本人也安装并使用了，识别率也大大提高，一些工作中也能利用到，特别不错~ 相关链接：https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/whl.md 安装与使用 pip安装： pip install paddleocr 注意：安装完成以后，运

PaddleOCR项目实战（1）：Python脚本中使⽤PaddleOCR

u013938578的博客

06-06

1803

本文介绍了一个基于PaddleOCR的Android应用开发项目。系统采用三层架构：前端（APP/Web/小程序）调用OCR接口，Nginx实现反向代理和负载均衡，SpringBoot构建OCR服务并通过Docker部署。重点讲解了Python开发PaddleOCR内部接口的过程，包括Flask框架的安装、接口测试以及集成PaddleOCR实现文字识别功能。代码示例展示了如何通过POST请求接收图片路径，使用PaddleOCR进行识别并返回JSON格式结果，同时添加了日志记录和异常处理。项目采用Docker

Python 最简单的OCR——paddleocr简要教程

McuBoy-C

02-21

2万+

Python 最简单的OCR ------------paddleocr 测试使用环境：Win10+Python3.7 环境搭载(控制台输入)：pip3 installpaddleocr 注意这里一定要以 pip3 安装。在py文件同级目录下放一个o.png图像。图像如下：测试代码如下: from paddleocr import PaddleOCR ocr=PaddleOC...

python+paddleocr 进行图像识别、找到文字在屏幕中的位置

热门推荐

pkloi的啵啵啵啵博客

12-06

3万+

最近在做自动化测试，因为是处理过的界面，所以使用pywinauto,LDTP获取控件进行操作的方法不可行，于是选择使用pyautogui进行图像识别与键盘鼠标控制。但是单独使用pyautogui测试效率很低，并且pyautogui图片识别并没有opencv识别率高，所以需要结合其他图像库使用。在使用的过程中发现，仅仅使用图像识别有时匹配度比较低，使用opencv进行图像识别定位，是图像像素太小查找成功的几率大大降低，于是想到使用OCR文本识别的方法对其进行查找，结合在一起使用，大大提高了工作效率。

win10下PaddleOCR初体验

weixin_43285186的博客

11-09

1942

PaddleOCR初体验

【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- 对PaddleOCR预测结果Result对象进行深度解析

qq_38614074的博客

07-02

2677

方法名方法说明参数参数类型参数说明默认值print()打印结果到终端bool是否对输出内容进行使用 JSON 缩进格式化。Trueindentint指定缩进级别，以美化输出的 JSON 数据，使其更具可读性，仅当 format_json 为 True 时有效。4bool控制是否将非 ASCII 字符转义为 Unicode。设置为 True 时，所有非 ASCII 字符将被转义；False 则保留原始字符，仅当 format_json 为 True 时有效。False。

Python使用paddleorc

ralrk的博客

08-26

372

查阅了一下是Python和paddleorc版本不兼容的问题，我使用的是3.13.7的Python，3.2.0的paddleocr。将Python降为3.7.0的版本后可以使用。正常安装之后一直报错：ImportError: cannot import name 'draw_ocr' from 'paddleocr'。使用了easyocr后效果不太理想，识别的误差很大，看了一下网上paddleorc的评价不错，准备试一下。测试实例后，识别文字的准确性比easyorc好太多，都是没有经过训练的情况下对比。

paddleocr+部署

03-30

<think>好的，我需要帮助用户了解如何部署PaddleOCR。根据用户提供的引用内容，我需要整理出清晰的步骤，并确保符合系统级指令的要求。首先，用户引用了四个关于PaddleOCR部署的资料，涵盖了环境安装、数据集制作、应用案例以及Windows本地部署等内容。我需要将这些信息整合成一个结构化的部署教程。第一步是环境搭建。根据引用1和4，需要安装PaddlePaddle框架和PaddleOCR。要确认Python版本是否符合要求，比如Python 3.6以上。安装命令可能需要使用pip，同时要注意GPU和CPU版本的选择，根据用户是否有CUDA环境来决定。第二步是安装依赖库，比如PaddleLabel用于标注数据，这部分在引用1中提到。需要列出必要的库，如PyMuPDF和shapely，特别是对于Windows用户，可能需要通过whl文件安装。接下来是数据集准备，引用1和2提到了数据集制作和标注。这里需要指导用户使用PaddleLabel进行标注，并正确划分训练集、验证集和测试集。要强调数据格式的转换，如导出为VOC或COCO格式，并生成对应的txt文件。然后是模型选择与配置，引用4的GitHub链接中有预训练模型，用户需要下载并根据需求调整配置文件，比如修改检测和识别模型的路径。部署应用部分，引用3提到了Windows下的本地部署，可能需要指导用户如何运行预测代码，处理图像输入，并输出OCR结果。代码示例需要符合Python语法，并且使用正确的API调用方式，如使用paddleocr.PPStructure进行表格识别。最后，用户可能需要优化部署，比如使用ONNX转换或Triton推理服务，这部分引用2提到了学术加速，可能涉及性能优化的方法。在整理过程中，要确保所有数学公式和代码块符合格式要求，比如变量用$...$包裹，代码块用三个反引号注明语言。同时，每个步骤末尾添加对应的引用标记，如[^1][^2]等。现在需要检查是否有遗漏的步骤，比如环境验证是否安装成功，可能需要在安装后运行简单的导入命令检查。另外，Windows用户可能遇到的特定问题，如依赖库的安装问题，是否需要额外说明，比如安装Shapely时的注意事项。还需要确保回答结构清晰，分步骤说明，并使用中文。最后生成相关问题，可能涉及部署中的常见问题、性能优化方法以及应用场景等。总结一下，回答的结构大致分为环境搭建、安装依赖、数据集准备、模型配置、部署应用、优化建议几个部分，每个部分包含具体命令和操作，并附上引用来源。最后列出相关问题，帮助用户深入了解更多内容。</think>### PaddleOCR部署教程 #### 一、环境搭建 1. **安装PaddlePaddle框架** 根据硬件环境选择CPU或GPU版本（需提前配置CUDA）： ```bash # CPU版本 pip install paddlepaddle # GPU版本（CUDA 11.2） pip install paddlepaddle-gpu==2.3.2.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html ``` 2. **安装PaddleOCR** 从GitHub克隆仓库并安装依赖： ```bash git clone https://github.com/PaddlePaddle/PaddleOCR cd PaddleOCR pip install -r requirements.txt ``` 引用[^4] #### 二、依赖库安装 - **Windows额外依赖** 需手动安装`PyMuPDF`和`Shapely`： ```bash pip install PyMuPDF==1.18.17 # 从第三方whl文件安装Shapely（如遇兼容性问题） ``` 引用[^3] #### 三、数据集准备 1. **标注工具安装** 使用PaddleLabel标注数据： ```bash pip install paddlelabel ``` 2. **数据格式转换** 标注后导出为VOC/COCO格式，生成训练文件`train.txt`、`val.txt`。引用 #### 四、模型选择与配置 1. **下载预训练模型** 从PaddleOCR的Model Zoo选择模型（如`ch_PP-OCRv3_det`）： ```bash wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar tar -xvf ch_PP-OCRv3_det_distill_train.tar ``` 2. **修改配置文件** 在`configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_student.yml`中指定模型路径和数据集路径。引用[^4] #### 五、部署与运行 1. **命令行调用** 使用内置脚本预测图像： ```bash paddleocr --image_dir ./imgs/11.jpg --use_angle_cls true --use_gpu false ``` 2. **Python API调用** 编写自定义脚本： ```python from paddleocr import PaddleOCR ocr = PaddleOCR(use_angle_cls=True, lang="ch") result = ocr.ocr("image.jpg", cls=True) for line in result: print(line[0][1]) # 打印识别文本 ``` 引用[^3][^4] #### 六、优化部署（进阶） - **模型轻量化**：使用量化工具压缩模型 - **服务化部署**：通过PaddleServing或Triton Inference Server发布API服务