
tesseract
文章平均质量分 91
蜗牛山
一步一步爬向内核
展开
-
在Qt中 调用 Tesseract,配置 C++ API
首先,我的环境:Ubuntu 16.04 + Tesseract-ocr 3.04 + QtCreator 5.6 有两种编译方式: cmake 和 qmake若使用 cmake 编译, 则要修改 CMakeLists.txt 文件。具体修改方法可以自行搜索。若使用 qmake 所以要修改 ~.pro 文件。这里使用的是简单的 qmake: 需要修改 ~.pro 文件,主要是将 tesse原创 2017-08-14 11:15:16 · 4518 阅读 · 1 评论 -
2 Tesseract-ocr 系列 : Tesseract-ocr training (训练)
关于Tesseract-ocr 训练的详细信息可以参照: tesseract-ocr Wiki:TrainingTesseract https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract或者: ubuntu下使用Tesseract-ocr(编译、安装、使用、训练新的语言库) http://blog.youkuaiyun.com/原创 2017-08-11 16:57:33 · 1107 阅读 · 0 评论 -
3 Tesseract-ocr 系列 : 安装 jTessBoxEditor,结合tesseract-ocr-3.4 训练
我的本地环境 Ubuntu16.04 + Tesseract-ocr-3.4 上篇博客中提到可以使用 jTessBoxEditor 这个工具生成带字体格式的字体图片文件 (~.tif 和 ~.box).这里主要将其安装和使用。因为 jTessBoxEditor 以来 java 虚拟机,所以在安装前要先安装 java。一、 安装 java主要参考: Ubuntu16.04安装java http:/原创 2017-08-11 17:48:47 · 4412 阅读 · 0 评论 -
5 Tesseract-ocr 系列 : 使用 jTessBoxEditor,结合 tesseract-ocr-3.4 进行训练、识别
首先,本地环境: Ubuntu 16.40 + Tesseract-ocr + jTessBoxEditor 1.7.3 (具体的环境搭建在之前都有介绍,此处不再赘述。)这里详细介绍使用图片文件作为输入的训练方法。比如我的训练素材是十张带字体格式的数字图片,最后我经过训练得到的语言库为: num1.tessdata准备好用作训练素材的图片: 跳转到 jTessBoxEditor 的安装目录,打开原创 2017-08-14 17:23:06 · 1014 阅读 · 0 评论