Python+Tesseract-OCR识别图片文字并保存到word文档

最新推荐文章于 2025-06-06 10:30:18 发布

Empty-Filled

最新推荐文章于 2025-06-06 10:30:18 发布

阅读量6.2k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： python 文章标签： python 图像识别 tesseract

本文链接：https://blog.youkuaiyun.com/lylfv/article/details/82776234

python 专栏收录该内容

57 篇文章

订阅专栏

本文介绍如何使用Python结合Tesseract-OCR引擎识别图片中的文字，并将识别结果保存至Word文档。涵盖Tesseract的安装配置、Pytesseract库的使用及中文识别优化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

使用Python+Tesseract-OCR识别图片文字并保存到word文档

本文通过使用 Tesseract-OCR 进行图片文本识别。并通过python进行后续处理把识别的文本保存到word文档。本文仅作为入门，由于对于中文图片的识别率并不高，需要后续优化。

安装Tesseract-OCR

Tesseract是一个开源文本识别引擎，通过Apache 2.0授权可用。可以直接使用，或者通过接口编程从图片提取文本，该引擎广泛支持各种语言，本文以Python为例说明：

去Windows安装包下载页面，选择需要的位数版本.
运行安装包，一路 下一步 直至安装完成；

配置Tesseract-OCR

添加安装目录到系统环境变量path，比如：

//添加安装目录到系统path
C:\Program Files (x86)\Tesseract-OCR;

通过CMD验证Tesseract-OCR工作

cmd运行tesseract

安装pytesseract

//cmd运行下列命令
pip install pytesseract

代码示例

from PIL import Image
import pytesseract
import os
import io

tessdata_dir = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
txt = pytesseract.image_to_string(Image.open(
    './img/20180804.jpg'), lang='chi_sim', config=tessdata_dir)
print(txt)

if not os.path.exists('./result'):
    os.mkdir('./result')

with io.open('./result/test.doc', 'w') as fp:
    fp.write(txt)