Tesseract-OCR3.05,4.003 Windows下编译

尝试过网上很多教程,但都无法编译出.exe 文件(但是库可以)。

所以我打算写一个建议的编译指南,细节就不写了 网上有很多资料。重点写一下遇到的一些问题。如果有问题也可以在我下面留言。

建议使用官网教程:https://github.com/tesseract-ocr/tesseract/wiki/Compiling。需要安装cppan。 不过这个软件的运行可能需要fangqiang,(我没用翻墙软件)(之前一直下载失败,后来我将缓存删了几次(C:\Users\用户名\.cppan),重新运行。尝试多次后成功了)cppan下载依赖库花费的时间比较长。

按照官网生成.sln文件,打开后尝试生成解决方案(会报很多错误)。几个常见错误:
1:找不到头文件:在源码中找到对应的头文件,将其加入到包含目录中。
2:pix.h 等 系统库文件报错。:找到使用了该头文件文件,添加include<Windows.h>。 如果依旧报错可能是 重复包含引起的,试着在其对应的.h 或.cpp 中添加include<Windows.h>。
3:字符编码原因: 找到对应文件,用记事本打开->另存为编码格式unicode。

4:“”:不知道为什么,一些文件中存在输出错误:存在 非英文的“”,将其批量删除后(你也可以替换成\" \");

自建库及其使用

使用参照https://www.cnblogs.com/cnlian/p/5765871.html

值得注意的是 可以用过 --psm 来设置分割方式,--oem来设置使用引擎 -l 来设置语言(可以通过+来同时设置多个语言,~来取消某个引擎(eng好像被默认加载了))。

我自建了一个手写镜像字母库。

下图是我手写的测试字母。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值