今天做了一个图片验证码识别,一共7行代码,你没看错,我也没说错,算上空行一共7行
下面就是见证奇迹的时刻
from PIL import Image
from pytesseract import *
im = Image.open('unknown.jpg')
aa = pytesseract.image_to_string(im)
print(aa)
示例图片:
运行效果:
俗话说,台上一分钟,台下十年功,代码是需要环境支撑的
系统环境:windows7
IDE:pycharm
Python版本:Python3.6
依赖包:pytesseract、tesseract、Tesseract-OCR、Pillow
将tesseract.exe执行目录加入环境变量path中
新增环境变量 TESSDATA_PREFIX (我的在D:\Tesseract-OCR)