PaddleOCR填坑记

本文详细记录了在Windows环境下使用PaddleOCR进行服务部署的过程,包括基于PaddleHub Serving的本地服务器部署和C++预测。在部署过程中遇到了如Shapely安装、VS2019配置、CMakeLists错误等问题,并给出了相应的解决方案。同时,针对模型预测中出现的裁边问题,调整了后处理参数unclip_ratio。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

写在前面:PaddleOCR是百度家出的深度学习based字符识别开源项目。为什么选PaddleOCR呢?在定调之前看过好多其他的开源项目,最初是找开源的CRNN实现,找到了pytorchOCR,并花时间学了一下基本的DL概念。再后来才发现转C++是如此的困难。既然生产难以实现,那对于我来说,实验室的结果再好也无法投入生产,也就没有意义(对于我的项目来说)。群里的大佬指了条明路,才开始了漫漫PaddleOCR挖坑之路。ps:群里的氛围还是不错的,特别对于我这种dl小白。下面就记录一下这段时间的成果吧!

PaddlePaddle是一系列开发组件,每一个组件都提供了训练部署一条龙全流程的服务。PaddleOCR独立出来,是一个单独的repo。而PaddleX为整个深度学习提供了全流程服务。值得注意的是,Paddle与Pytorch是并列关系,都是深度学习框架,Paddle和Pytorch很像,所以基本能做到无缝切换(听说是)。

为什么要部署(deploy)?

开发环境和生产环境有很大不同,硬件设备上来说,开发电脑的配置高级显卡,而出货电脑就没必要那么高级,能用就行,所以这就要求我们训练好的模型能在出货的电脑上跑起来,牺牲部分精度保证速度。(这个看具体需求,比如医疗影像,是绝对不能牺牲精度的)综上,理由一,**生产电脑性能差。**理由二,python不适合用于生产环境,说白了还是考虑运行速度,尤其是工业环境,用C++/C#的多,python依赖太多,不合适。这是目前我认识到的,欢迎补充。当然如果就是开发类似PaddleX GUI的开发深度学习的软件,那就可以考虑直接用python环境了。目前GUI还没开源,官方说是基于PaddleX API开发的,研究一下应该自己也能做。貌似是pyinstaller打包的。

有哪几种方式?

Linux的ubuntu 1804下官方提供的那几种都可以用:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值