RapidOCR-json：轻量级离线OCR解决方案

宋韵庚

于 2024-06-05 10:07:54 发布

阅读量568

点赞数 4

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gitblog_00089/article/details/139463771

RapidOCR-json：轻量级离线OCR解决方案

RapidOCR-json OCR离线图片文字识别命令行windows程序，以JSON字符串形式输出结果，方便别的程序调用。基于 RapidOcrOnnx 。项目地址: https://gitcode.com/gh_mirrors/ra/RapidOCR-json

项目介绍

RapidOCR-json 是一个基于 RapidOcrOnnx 的离线图片OCR文字识别程序。它通过管道等方式输入本地图片路径，输出识别结果的JSON字符串，适用于 Win7 x64 及以上的系统。该项目旨在提供一个封装好的OCR引擎组件，使得没有C++编程基础的用户也可以用其他语言简单地调用OCR，享受到更快的运行效率、更便捷的打包&部署手段。

项目技术分析

技术栈

RapidOcrOnnx：作为底层OCR引擎，提供高效的文字识别能力。
ONNX：使用ONNX模型进行推理，确保跨平台的兼容性和高性能。
JSON：通过JSON格式输出识别结果，便于不同语言的集成和解析。

性能对比

| 特性 | PaddleOCR-json | RapidOCR-json | | ------------------ | ----------------------------------------------- | -------------------- | | CPU要求 | 需要AVX指令集，不支持部分低端CPU | 无特殊要求 👍 | | 推理加速库 | mkldnn 👍 | 无 | | 识别速度 | 快（启用mkldnn加速）👍 | 中等 | | 初始化耗时 | 约2s，慢 | 0.1s内，快 👍 | | 组件体积（压缩） | 52MB | 15MB 👍 | | 组件体积（部署） | 250MB | 30MB 👍 | | CPU占用 | 高，榨干硬件性能 | 较低，对低配机器友好 | | 内存占用峰值 | >2000MB（启用mkldnn） | ~500MB 👍 |

项目及技术应用场景

应用场景

文档数字化：将纸质文档转换为可编辑的电子文档。
图像文字提取：从图片中提取文字信息，用于数据分析或内容识别。
自动化办公：自动化处理包含文字的图片，如发票识别、名片识别等。
嵌入式系统：在资源受限的嵌入式设备上实现轻量级OCR功能。

技术优势

轻量级：组件体积小，部署方便，适合资源受限的环境。
高效：虽然识别速度中等，但初始化耗时极短，适合频繁调用的场景。
易用：提供Python API，方便开发者集成到现有项目中。

项目特点

1. 无特殊CPU要求

RapidOCR-json 对CPU没有特殊要求，即使是低端CPU也能流畅运行，这使得它在广泛的硬件平台上都能得到应用。

2. 快速初始化

初始化耗时在0.1秒内，远低于其他OCR引擎，适合需要快速启动的应用场景。

3. 低资源占用

组件体积小，CPU和内存占用低，对低配机器友好，适合嵌入式系统和资源受限的环境。

4. 多语言支持

通过JSON格式输出识别结果，便于不同语言的集成和解析，支持Python API，方便开发者快速集成。

5. 灵活的输入方式

支持通过图片路径、图片base64编码等多种方式输入图片，满足不同场景的需求。

结语

RapidOCR-json 是一个轻量级、高效且易于集成的离线OCR解决方案，适合各种资源受限的环境和应用场景。无论你是开发者还是普通用户，都可以通过简单的操作享受到高效的文字识别服务。快来试试吧！

RapidOCR-json OCR离线图片文字识别命令行windows程序，以JSON字符串形式输出结果，方便别的程序调用。基于 RapidOcrOnnx 。项目地址: https://gitcode.com/gh_mirrors/ra/RapidOCR-json

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

宋韵庚 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。