Tess4j下载地址 https://sourceforge.net/projects/tess4j/
需要的包:解压后dist文件夹中tess4j-3.4.8.jar与lib文件夹中所有的jar包构建路径
压缩包中只有英文字符集 可以在 此链接 https://github.com/tesseract-ocr/tessdata 中下载chi_sim.traineddata中文简体字符集
在与src同等级新建一个tessdata文件夹,将字符集放入
import java.io.File;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
public class MyOCR {
public String ocr(File s) throws TesseractException {
ITesser

本文介绍了如何利用Tess4j进行OCR识别,包括下载Tess4j库,添加必要的jar包到构建路径,并提供链接获取中文简体字符集chi_sim.traineddata,该数据集需要放在tessdata文件夹中。
最低0.47元/天 解锁文章
332

被折叠的 条评论
为什么被折叠?



