Tesseract+Pillow识别图片初体验

首先要安装pillow和pytesseract

pip install pillow 
pip install pytesseract

安装Tesseract

tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/

然后全选一路往下就行……

配置环境

配置tesseract的安装路径

执行命令

setx TESSDATA_PREFIX G:\tesseract\tessdata

测试代码

from PIL import Image
import subprocess


def cleanFile(filePath, newFilePath):
    image = Image.open(filePath)
    # 对图片进行阈值过滤,然后保存
    image = image.point(lambda x: 0 if x < 143 else 255)
    image.save(newFilePath)
    # 调用系统的tesseract命令对图片进行OCR识别
    subprocess.call(["tesseract", newFilePath, "output"])
    # 打开文件读取结果
    # 打开文件读取结果
    for line in open("output.txt", 'r', encoding='UTF-8'):
        print(line)



cleanFile("download/b.jpg", "text_2_clean.png")

执行!!!!

完美再来试试!!!

ok~简单的一个识别图像的Demo完成了!!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值