tesseract-ocr广为传播的,必需置顶,但是对中文的处理不是很好,如果是自然场景,基本就呵呵了,
参考链接: https://github.com/tesseract-ocr
这是北京的一位AI大牛个人的试验程序,中文效果不错,本人也有参与,大家可以试下在这基础上结合自己的应用场景,进行拓展,
参考链接:https://github.com/senlinuc/caffe_ocr
关于图片合成的链接,大家可以关注佟派AI团队的研究进展 我看过他们的论文,他们就是首个主张运用合成图片数据,并且取得比较好的效果的团队,鸡冻,
参考链接:https://github.com/tongpi
,如果你有可以共享的标注数据,请在留言区留言,或私信我,很想发起一个共建共用标注数据图片库。
另外对于图片处理,主流的有OpenCV,PIL,leptonica,我随大流了,选择了OpenCV,可是很少有人知道在OpenCV之前就有的Leptonica,如果你用Linux系统,你就会知道她的功能强大与速度惊人,Tesseract-OCR源码中处理图片就是选择了Leptonica。
本文探讨了Tesseract-OCR的局限性,特别是在中文识别方面的问题,并推荐了一款由北京AI专家开发的中文识别效果更佳的解决方案。此外,文中还提到了用于生成训练数据的图片合成技术及相关的研究团队,并分享了作者在图片处理库选择上的经验。
2515

被折叠的 条评论
为什么被折叠?



