一、概述
因为要实现OCR功能,自己实现不了,就要用第三方的库,经过筛选之后打算引入两种OCR识别引擎。一种是tesseract、一种是winrt的微软OCR。
引入两种是因为识别效果的问题,因为目的主要是识别一些基础场景,比如pdf、一些简单的图片的文字提取,首先只引入了tesseract,但是某些场景识别效果一般。后来又调研了一下其它的,比如easyocr,效果不错,但是识别慢,还是基于python+pytorch的,不太好办。后来看到win11自带的这个ocr,对于这种基础场景识别效果还不错。
再多说一句,网上有说法是tesseract过时了,感觉有失公允,tesseract官方提供的通用模型可能效果不是很好,但是毕竟提供了对于模型进行微调的方法,非常适合特定场景自定义训练。
下面说一说关于如何引入并进行测试。
二、引入tesseract
1、获得编译的库
既然要引入库那要么就下载源码自己编译,要么就找编译好的。这里懒得编译,所以使