tesseract 训练字库先做两个准备工作
1.下载工具cowboxer
http://download.youkuaiyun.com/detail/cxf7394373/5305519
2. 下载tesseract-ocr.exe
https://code.google.com/p/tesseract-ocr/downloads/list
3. 安装tessract-ocr
我直接安装在了D:\\下面
现在可以开始了,训练步骤包括以下几步:
1. 识别图片
打开cmd,cd 至D:\\tesseract\\下面,拷贝一张图片1.tif至该目录下,执行下面的命令
tesseract 1.tif 1 –l chi_sim batch.nochopmakebox
2.在cowbox中调整方框大小
在D:\\tesseract\\下会生成一个文件1.box,用cowboxer工具打开1.box,会显示如下图的内容&