爬虫遇到了验证码无法识别?
PDF 里的扫描文档让你无从下手?
公司的有 OCR 需求但又不想花钱?
写论文就想 抄参考 一段,但文库下载都要收费?
不用担心这些了!
来吧朋友,这款适合人类食用的离线中文 OCR 项目解决你所有的烦恼!
今天的主角就是这款在 github 上开源的项目:TrWebOCR
介绍
项目是基于开源离线 OCR 项目 Tr构建的,
解决了 Tr 不支持并发的问题,
并且提供了 web 页面和 web 接口可使用,
因此无论是日常的使用还是其他项目调用也都十分的方便。
效果
明人不说暗话,是骡子是马拉出来遛遛就知道了!
下面是可能比较常用的两个场景:文档和验证码的识别。
文档识别的置信度基本在 99%,验证码识别出的置信度也在 72%以上。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-J7faMyZQ-1588778904711)(https