tesseract-ocr和tess-two软件代码深度优化

tesseract-ocr是目前做得最好的一款开源OCR软件,包括PC版本和Android版本tess-two。但是由于1)包含了较为复杂的页面分析;2)最早为英语开发,后扩展到多种语言,需要适应的范围广,导致其用于汉字OCR时速度较慢、效率较低。按不同的电脑配置,10个汉字需要2~5秒。本人之前由于项目需要,对tesseract-ocr源代码进行了深入的学习分析,可根据特定的应用场景对tesseract-ocr和tess-two进行核心代码层级的优化,使运行效率提高一个数量级。本人之前的项目,原生代码识别10个汉字需要2~3秒,优化后运行时间为100~200毫秒。有需要的,详细情况可以给我留言或联系我QQ34841693。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值