OCR识别图像中的字符

最新推荐文章于 2024-04-25 08:23:53 发布

原创

最新推荐文章于 2024-04-25 08:23:53 发布 · 705 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#OCR

这篇博客介绍了如何在Python中使用Python-tesseract库进行OCR识别，详细讲述了安装过程和解决遇到的问题，如Tesseract未安装和路径问题。通过示例代码展示了识别图像中的文本，但指出该库在识别中文字符方面存在不足。

OCR识别图像中的字符

- 介绍
- 环境
- 安装
- 遇到的问题
- 识别代码

介绍

Python-tesseract是python的光学字符识别（OCR）工具。也就是说，它将识别并“读取”嵌入图像中的文本。

Python-tesseract是Google的Tesseract-OCR引擎的包装器。它作为独立的调用脚本也很有用，因为它可以读取Python Imaging Library支持的所有图像类型，包括jpeg，png，gif，bmp，tiff等，而tesseract-ocr默认只支持tiff和bmp。此外，如果用作脚本，Python-tesseract将打印已识别的文本，而不是将其写入文件。
参考：https://blog.youkuaiyun.com/u010675669/article/details/81663182