Tesseract-OCR 4.0LSTM训练流程 (Windows环境下）

最新推荐文章于 2025-07-04 10:41:51 发布

从你的全世界路过2

最新推荐文章于 2025-07-04 10:41:51 发布

阅读量7.4k

点赞数 11

CC 4.0 BY-SA版权

分类专栏：图文字识别文章标签： Tesseract-OCR3.0和4.0以上版本进行训练步骤图文字识别光文字识别

本文链接：https://blog.youkuaiyun.com/qq_30110069/article/details/98742701

本文介绍了在Windows环境下使用Tesseract-OCR 4.0 LSTM进行训练的详细步骤，包括生成.tif和.box文件、.lstmf文件、提取.lstm文件、创建训练文件列表、训练模型、合并文件生成新的.traineddata，并最终应用于OCR识别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Tesseract-OCR 4.0LSTM训练流程 (Windows环境下）**

目前网上关于tesseract3.0版本的训练过程很多，但是基于lstm的4.0版本的训练几乎没有，自己深受困扰，后经过自己努力终于成功训练，特地写下来希望可以av帮助需要的人。

首先根据网上的教程安装tesseract4.0以上的版本，这里不详细说明如何安装。

1. 准备训练文本.txt格式的文件和字体文件font，里边包含.ttf格式的字体文件
在这里插入图片描述

2. 利用text2image生成.tif和.box文件
从font和.txt所在的目录下，通过cmd进入命令窗口，输入以下内容

text2image --text="D:\new_05\text.txt" --outputbase="D:\new_05\zth.font.exp0" --fontconfig_tmpdir="%temp%"
 --font="HGMaruGothicMPRO" --fonts_dir="D:\new_05\font"

其中每个参数的意义为：

–text=“D:\new_05\text.txt” 是要进行训练的样本文件路径

–outputbase=“D:\new_05\zth.font.exp0” 表示生成的.tif和.box文件的路劲和命名（注意命名方式，可参照3.0的介绍）

–fontconfig_tmpdir="%temp

最低0.47元/天解锁文章

200万优质内容无限畅学