
Tesseract
十有八⑨
这个作者很懒,什么都没留下…
展开
-
Tesseract-OCR引擎 入门
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。 Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。当前版本为3.01. 项目地址为:http://code.google.com/p/tess转载 2017-12-21 08:30:19 · 1213 阅读 · 0 评论 -
Windows环境安装tesseract-ocr 4.00并配置环境变量
最近要做文字识别,不让直接用别人的接口,所以只能尝试去用开源的类库。tesseract-ocr是惠普公司开源的一个文字识别项目,通过它可以快速搭建图文识别系统,帮助我们开发出能识别图片的ocr系统。因为Windows环境开发,我也就必须在windows环境安装系统。 第一步:下载安装包 根据https://github.com/tesseract-ocr/tesseract/wiki,我找到非转载 2017-12-20 17:16:16 · 4533 阅读 · 2 评论