Ubuntu/Debian/Deepin安装:
直接使用apt安装
sudo apt-get insatll -y tesseract-ocr libtesseract-dev liblepyonica-dev
查看支持语言:
tesseract --list-langs
开始支持语言并不多,需要我们自己下载
sudo git clone https://github.com/tesseract-ocr/tessdata.git
sudo mv tessdata/* /usr/shar/tesseract/4.0/tessdata
#注意:4.0为版本名,版本不尽相同,要找好位置
再次查看支持语言:
tesseract --list-langs
再次安装:
sudo pip3 install tesserocr pillow
测试
保存一张图片,用以下命令执行
tesseract xxx.png result -l eng
##xxx.png 为当前目录下照片名字
##result 为导出文本的文本名称
##-l 所用语言 eng==english
本文详细介绍了在Ubuntu、Debian和Deepin系统中如何通过apt命令安装OCR工具Tesseract,并配置支持多种语言的方法。首先,通过sudo apt-get install命令安装基本组件,然后使用git clone下载额外的语言包并移动到正确位置。最后,通过pip3安装额外的Python库以增强OCR功能,文章还提供了测试命令。
3万+

被折叠的 条评论
为什么被折叠?



