- 下载tesseract-ocr-setup-4.00.00dev
链接:https://pan.baidu.com/s/1m6ChbOWFIAp8q2sntIK9Qg
提取码:npbz - 下载成功后点击exe文件进行安装
根据提示进行安装,在出现下面的多选框时,这几个选项要选择,点击language data的加号,增加语言
若需要下载识别其他语言的字符,可进入官网直接下载对应语言包,下载完成后放到Tesseract-OCR\tessdata\tessconfigs下即可 - 安装完之后就可以来配置环境变量
- 进入环境变量中,找到path,新建路径:F:\softrun\Tesseract-OCR(根据自己的安装位置来写)
- 新增一个环境变量TESSDATA_PREFIX=F:\softrun\Tesseract-OCR
配置就完成
- 测试是否安装成功
输入tesseract -v如果出现版本号则安装成功,如下图所示
- 进行识别
打开cmd->定位到所要识别的图片的位置
输入如下语句:tesseract pic3.png a [ -l chi_sim]
pic3.png是你图片的名称,a是保存文字的txt文件,后缀名可省略,默认的识别语言是英文,如果是中文要利用-l chi_sim换成中文
tesseract的安装以及在python中的使用
最新推荐文章于 2025-07-02 17:45:14 发布