最近接触OCR,先收集一些资料,包括成熟软件、SDK、流行算法。
1. 一个对现有OCR软件及SDK的总结,比较全面,包括支持平台、编程语言、支持字体语言、输出格式、相关链接等
http://en.wikipedia.org/wiki/List_of_optical_character_recognition_software
以此为索引,比较、选择你想要的OCR SDK。
2. 另外一个OCR SDK 网站链接,商用,号称high performance,未深入了解,链接如下:
3. 一个大学UCI 给出的handwriting数字的 training及testing数据:
http://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits
其每个数字近550个样本,出自43个人,30个人的用于training,13个人的用testing。其网站上有详细介绍。
4. 一个哥们对开源的OCR 库的总结:

博客内容涉及OCR技术的学习,列举了多个OCR软件、SDK和资源,特别提到了tesseract OCR引擎的使用方法和优化策略。通过调整参数、预处理图像、设置识别白名单等方式,可以提高识别率。在单个字符的测试中,识别率达到了90%。
最低0.47元/天 解锁文章
3万+

被折叠的 条评论
为什么被折叠?



