目前项目有个业务,需要将扫描件的文本进行提取,扫描件是中文,市面是有没有比较好的中文OCR提供API,最好是java的,哪个厂商比较好,多少钱。当然如果有开源的最好。
关于java写的OCR好像讨论的很少,google上搜了下,发现基本都是c/c++的
开源的主要有:
tesseract-ocr:http://code.google.com/p/tesseract-ocr/
GOCR:http://jocr.sourceforge.net/
有个付费的:
javaocr:http://www.javaocr.com/
但以上都是只支持英文,这次项目里有个业务,需要提取扫描件的文本,不知道有没有厂商开发API,费用多少?
关于java写的OCR好像讨论的很少,google上搜了下,发现基本都是c/c++的
开源的主要有:
tesseract-ocr:http://code.google.com/p/tesseract-ocr/
GOCR:http://jocr.sourceforge.net/
有个付费的:
javaocr:http://www.javaocr.com/
但以上都是只支持英文,这次项目里有个业务,需要提取扫描件的文本,不知道有没有厂商开发API,费用多少?
本文探讨了当前项目中中文OCR技术的需求,分析了市面上可用的OCR解决方案,包括开源项目如tesseract-ocr及付费方案javaocr等,并提出寻找支持中文的OCR API的需求。
403

被折叠的 条评论
为什么被折叠?



