opencv保姆级讲解——光学学符识别(OCR)（4）

头发不掉光

于 2024-11-05 18:27:22 发布

阅读量1.6k

点赞数 15

CC 4.0 BY-SA版权

文章标签： opencv ocr 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_74994555/article/details/143520037

光学字符识别

（Optical Character Recognition, OCR）是指对文本材料的图像文件进行分析识别处理，以获取文字和版本信息的过程。也就是说将图象中的文字进行识别，并返回文本形式的内容

以下是比较流行的开源的ORC识别库

Tesseract OCR Tesseract 是 Google 赞助的一个开源 OCR 引擎，支持多种语言，包括中文。它是最流行和最成熟的 OCR
PaddleOCR PaddleOCR 是基于 PaddlePaddle 的 OCR 工具，集成了文本检测和识别模型，支持多种语言，包括中文。
EasyOCR EasyOCR 是一个轻量级的 OCR 库，支持多种语言，包括中文。它使用 PyTorch 作为后端

PaddleHub 介绍

PaddleHub现已开源OCR文字识别的预训练模型

移动端的超轻量模型：仅有8.6M，chinese_ocr_db_crnn_mobile。

服务器端的精度更高模型：识别精度更高，chinese_ocr_db_crnn_server。

该 Module 用于识别图片当中的汉字、数字、字母。如果仅需要检测，也可单独使用chinese_text_detection_db_server或者chinese_text_detection_db_mobile得到检测结果的文本框

开发者可以基于PaddleHub提供的OCR中文识别Module，实现一键文字识别，适用于常见的OCR应用场景中。

OCR的应用场景

根据OCR的应用场景而言，我们可以大致分成识别特定场景下的专用OCR以及识别多种场景下的通用OCR。就前者而言，证件识别以及车牌识别就是专用OCR的典型案例。针对特定场景进行设计、优化以达到最好的特定场景下的效果展示。那通用的OCR就是使用在更多、更复杂的场景下，拥有比较好的泛性。在这个过程中由于场景的不确定性，比如：图片背景极其丰富、亮度不均衡、光照不均衡、残缺遮挡、文字扭曲、字体多样等等问题，会带来极大的挑战。现PaddleHub为大家提供的是超轻量级中文OCR模型，聚焦特定的场景，支持中英文数字组合式别、竖排文字识别、长文本识别场景

应用案例

下面是完整案例

import paddlehub as hub
import cv2
#识别图片的文字
def

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。