python 使用tesseract进行图片识别

本文介绍了如何在Python中使用pytesseract模块进行图片文字识别。首先,需要安装Pillow和pytesseract模块,然后下载并安装tesseract-ocr软件,注意记录其安装路径。接着,可能需要修改pytesseract.py文件中的tesseract_cmd路径,以确保程序能够正确运行。
1 from PIL import Image
2 import pytesseract
3 
4 text = pytesseract.image_to_string(Image.open(r'E:\guo\2432.jpg'),lang='chi_sim')
5 print(text)

1.需要安装二个模块,

PIL 直接使用 pip install PIL 会报错 使用 pip install Pillow 即可安装PIL

第二个直接 pip install pytesseract

2安装好了模块还需要下载 tesseract-ocr

下载网址:https://github.com/UB-Mannheim/tesseract/wiki

选择自己的版本下载,下载之后直接安装即可。注意要记住安装的位置,等下需要用到

修改pytesseract.py 文件里面的指向路径

打开方式可以在pycharm 输入import pytesseract.pytesseract 然后按住ctrl键鼠标对着pytesseract右键点击进去

遇到python不懂的问题,可以加Python学习交流qun  688244617一起学习交流,还有零基础入门的学习资料和大量干货哦


1 from io import BytesIO
2 pandas_installed = find_loader('pandas') is not None
3 if pandas_installed:
4     import pandas as pd
5 
6 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
7 tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
8 RGB_MODE = 'RGB'

其中tesseract_cmd是我已经修改了的地址,tesseract.exe在刚刚安装位置里面,将这里设置好了运行就不会报错

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值