paddleocr识别使用初体验

本文介绍PaddleOCR的安装与应用,展示如何通过Python脚本实现图像文字检测与识别,并讨论了场景文字识别技术面临的挑战及解决方案。

1、安装过程:

pip install paddlepaddle

如果是安装gpu版本,对应的版本选择参考:飞桨PaddlePaddle-源于产业实践的开源深度学习平台

pip install paddleocr

2、应用:

import time
import gradio as gr
from paddleocr import PaddleOCR, draw_ocr
import io
import numpy as np
# 模型路径下必须含有model和params文件

import base64
from PIL import Image
ocr = PaddleOCR(use_angle_cls=True,use_gpu=True)#det_model_dir='{your_det_model_dir}', rec_model_dir='{your_rec_model_dir}', rec_char_dict_path='{your_rec_char_dict_path}', cls_model_dir='{your_cls_model_dir}', use_angle_cls=True
# img_path = 'G:/my_learn/image_ocr/image1.jpg'
# img_file = open(img_path,'rb')
# img_b64encode = base64.b64encode(img_file.read())
start = time.time()
# img_b64decode = base64.b64decode(img_b64encode)
# image = io.BytesIO(img_b64decode)
# img = np.array(Image.open(image))
def handle(input_file_path):
    print(i
C# 使用PaddleOCR进行文字识别的过程涉及几个关键步骤,包括环境配置、模型加载以及图像处理等。下面是一个简单的指南帮助您入门: ### 环境准备 首先需要确保您的环境中已经安装了.NET框架,并且拥有Visual Studio或其他支持C#项目的IDE工具。 对于PaddleOCR本身而言,它是由Python编写的,所以一般情况下直接在C#项目里调用并不直观。但是我们可以通过创建一个基于Flask/Django的服务端API接口来桥接这两者——即利用Python服务来进行实际的文字检测任务并将结果返回给C#客户端;或是考虑使用一些第三方库如[PaddleSharp](https://github.com/PaddlePaddle/PaddleClas/tree/release/2.4/deploy/csharp),它是专门为简化从C#访问PaddlePaddle模型而设计的一个包装器。 ### 方案一:通过REST API连接到远程服务器 如果选择方案一是建立Web Service的方式的话,则需按以下操作流程完成设置: 1. **搭建Python OCR Server** - 利用类似`Flask`这样的微框架构建简易HTTP接口; 2. **发送请求至Server** - C#应用程序向指定URL发起POST或GET请求并附带待分析图片数据; 3. **接收响应解析JSON** - 根据来自服务端反馈的信息提取所需文本内容。 ```csharp using System.Net.Http; // ...其他必要的命名空间引用... public async Task<string> RecognizeTextAsync(string imageUrl) { using var client = new HttpClient(); HttpResponseMessage response = await client.GetAsync(imageUrl); // 假设这里会得到一张Base64编码后的字符串形式的图片 string base64ImageString = Convert.ToBase64String(await response.Content.ReadAsByteArrayAsync()); HttpContent content = new StringContent($"{{\"image\": \"{base64ImageString}\"}}", Encoding.UTF8, "application/json"); HttpResponseMessage ocrResponse = await client.PostAsync("http://your-ocr-server-url/predict", content); return await ocrResponse.Content.ReadAsStringAsync(); } ``` ### 方案二:使用本地部署(PaddleSharp) 若采用第二种办法即将PaddleOCR集成进Windows桌面应用之内,则可以参考官方文档指导逐步引入所需的依赖项及初始化预测引擎实例化过程,在此不做过多赘述,您可以查看[GitHub仓库](https://github.com/PaddlePaddle/PaddleClas)了解更多信息。 请注意以上只是一种概述性的描述,具体实现细节取决于个人需求和偏好设定。此外由于技术更新迭代较快的缘故,请始终关注最新版本发布说明和技术博客获取最前沿的支持信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

会发paper的学渣

您的鼓励和将是我前进的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值