TesseractOCR安装详解及简单测试

本文详细介绍了在Ubuntu、Debian和Deepin系统中如何通过apt命令安装OCR工具Tesseract,并配置支持多种语言的方法。首先,通过sudo apt-get install命令安装基本组件,然后使用git clone下载额外的语言包并移动到正确位置。最后,通过pip3安装额外的Python库以增强OCR功能,文章还提供了测试命令。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Ubuntu/Debian/Deepin安装:

直接使用apt安装

sudo apt-get insatll -y tesseract-ocr libtesseract-dev liblepyonica-dev

查看支持语言:

tesseract --list-langs

 开始支持语言并不多,需要我们自己下载

sudo git clone https://github.com/tesseract-ocr/tessdata.git
sudo mv tessdata/* /usr/shar/tesseract/4.0/tessdata
#注意:4.0为版本名,版本不尽相同,要找好位置

再次查看支持语言:

tesseract --list-langs

 再次安装:

sudo pip3 install tesserocr pillow

测试

保存一张图片,用以下命令执行

tesseract xxx.png result -l eng
##xxx.png 为当前目录下照片名字
##result 为导出文本的文本名称
##-l 所用语言 eng==english

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值