OCR - Tesseract的Windows下安装使用及ocr识别

坐望云起

已于 2023-03-15 14:07:41 修改

阅读量4.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习从入门到精通文章标签： tesseract win10 ocr LSTM 光学字符识别

于 2022-01-07 18:44:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/bashendixie5/article/details/122368910

深度学习从入门到精通专栏收录该内容

797 篇文章 ¥99.90 ¥299.90

订阅专栏

本文详细介绍了光学字符识别技术OCR的基本原理，并在Win10环境下，阐述了Tesseract OCR的安装过程和使用方法，包括英文、数字、汉字的识别。同时，文章也指出了Tesseract的局限性，强调了图像预处理和深度学习的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、光学字符识别技术

OCR（Optical Character Recognition），中文是光学字符识别。是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。

主要包含以下技术

1、图像输入：要进行OCR识别，第一步就是通过采集所要识别的图像，可以是名片、身份证、护照、行驶证、驾驶证、公文、文档等等，然后将图像输入到识别核心区域。

2、图像进行预处理：此过程包含二值化（像素）、去噪、倾斜度矫正等

3、版面分析：将所要识别的文档分段、分行处理

4、字符切割：此步骤需要字符定位和字符切割，定位出字符串的边界，然后分别对字符串进行单个切割，单个分割出来的字符再做识别。

5、字符特征提取：提取需要的字符特征，为后面的识别提供依据。

6、字符识别：将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配，识

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

坐望云起 如果觉得有用，请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。