一、介绍
批量文字识别(OCR)是Python办公自动化的基本操作,应用在我们工作生活中的方方面面,比如车牌识别、证件识别、银行卡识别、票据识别等等。
Python中OCR第三方库非常多,比如easyocr、PaddleOCR、cnocr等等。
EasyOCR 是一个用 Python 编写的 OCR 库,用于识别图像中的文字并输出为文本,支持 80 多种语言。
检测部分使用CRAFT算法,识别模型为CRNN,由3个组件组成:特征提取Resnet、序列标记LSTM、解码CTC。整个深度学习过程基于pytorch实现。
图片--预处理(去噪、色彩饱和度、尖锐处理等)--文字检测(CRAFT)--中间处理(倾斜处理等)---文字识别---后续处理---输出结果
二、安装
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple easyocr
模型储存路径:
windows: C:\Users\username\.EasyOCR\linux:/root/.EasyOCR/
easyocr 的深度学习算法依赖于另一个著名的第三方模块 pytorch,图形处理部分则会用到 opencv、Pillow 等,所以还需要确保自己电脑上已经安装这些基础模块。
首次使用easyocr识别图片,会自动从网络中下载预训练模型。下载耗时较长,而且大概率遇到URLError错误,
推荐下载模型文件(下载链接:Jaided AI: EasyOCR model hub),不用解压直接复制粘贴于~/.EasyOCR/model/目录下。

本文介绍了Python OCR库EasyOCR的使用,包括安装、API文档和基本操作。EasyOCR支持80多种语言,适用于车牌、证件、银行卡等文字识别。安装时,可从模型库下载预训练模型,API主要方法为readtext,参数包括图像处理、文本检测和合并策略等。此外,还讨论了训练自定义识别模型的方法和使用自定义模型的步骤。示例代码展示了如何读取和识别图像中的文字。
最低0.47元/天 解锁文章
1750

被折叠的 条评论
为什么被折叠?



