Tesseract有发布版也有代码版,对于真正想学习里面算法的同学,仅仅有发布版是不够用的,将代码跑通是必要的一步。而github上下载的tesseract是无法直接运行的,会出现一定的问题。而网上所谓的一些能跑通的工程下载后也不一定可以运行,查阅了很多很多资料,试了很多次错才将程序跑通,下面总结一下我遇到的一些问题,给出解决方案,供大家参考。
背景
由于项目需求,我需要在vs2008上运行Tesseract,所以我选择了Tesseract3.02.02版本。这个版本Tesseract源码中还是有相应工程的。但是这个工程缺少依赖会报错。
(这个过程中我也曾试过直接从网上找能运行好的工程,但是并没有找到能够直接运行的程序,至少是针对我的需求。也曾下过很多版本的程序,茫然无措,甚至想过放弃在vs2008上运行,但是所幸坚持下来就会有好的结果啦,所以也想跟大家说句鸡汤,坚持就是胜利。)
实操
- 下载tesseract版本是个选择,我比较建议去github上tesseract官方链接下载相应tesseract版本,我选择了3.02.02的zip下载包。
- 解压后选择vs2008的工程打开,运行报错。
- 报错情况一开始是缺少allheaders.h文件,查阅网上相关资料,这是由于tesseract缺少leptonica依赖产生的问题。需要下载leptonica。这里给出下载链接leptonica官网,里面有leptonica的各版本源码等,这里经过我试错得知,我们下载leptonica-1.68-win32-lib-include-dirs.zip 即可,里面就包含了全部tesseract需要的lib和头文件等。(网上一些资料说tesseract3.02.02版本的需要下载leptonica1.70以上版本的可以忽略,并没有关系)下载后解压,将相应