记录在macOS Mojave上安装tesseroct with training tools
其中遇到几个bug,第一个是git clone时官方文章没有设置branch,导致只要版本高于4.0.0,编译training部分时必定报代码异常。
cd /yourdir/
git clone https://github.com/tesseract-ocr/tesseract/ --branch 4.0.0
然后,由于安装training tools时只在/usr/local/include目录下找.h文件,所以在configure的时候就要把link加上。
sudo ./configure CPPFLAGS=’ -I/usr/local/opt/icu4c/include -I/usr/local/Cellar/glib/2.60.2/include/glib-2.0 -I/usr/local/Cellar/glib/2.60.2/lib/glib-2.0/include -I/usr/local/Cellar/freetype/2.10.0/include/freetype2 ’ LDFLAGS=’-L/usr/local/opt/icu4c/lib -L/usr/local/Cellar/freetype/2.10.0/lib -L/usr/local/Cellar/glib/2.60.2/lib’ pango_CFLAGS=’-I/usr/local/Cellar/pango/1.42.4_1/include/pango-1.0’ pango_LIBS=’-L/usr/local/Cellar/pango/1.42.4_1/lib’ cairo_CFLAGS=’-I/usr/local/Cellar/cairo/1.16.0/include/cairo’ cairo_LIBS=’-L/usr/local/Cellar/cairo/1.16.0/lib’
软件版本号是我当前时间的版本号。如果安装时最好确定下路径是否正确。
最后,安装training部件时的命令是sudo make training-install,否则不会在bin里加替身。
而后,需要在tesseract目录下tessdata中git clone https://github.com/tesseract-ocr/tessdata.git,然后把tessdata加入.bash-profile。
安装这玩意搞了我两天一夜,不说了,吃东西去。