1OCR
OCR (Optical Character Recognition,光学字符识别),是指电子设备(例如扫描仪或
数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别
方法将形状翻译成计算机文字的过程;针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件识别图像中的文字等信息的技术。
2 ddddocr
ddddocr 是一款简单实用的识别验证码的库。
安装方法如下:
镜像安装:pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple
或 pip install ddddocr -i https://mirrors.aliyun.com/pypi/simple/
有的环境可能需要 numpy 更新
pip install --upgrade numpy -i https://mirrors.aliyun.com/pypi/simple/
3使用案例
import ddddocr
ocr = ddddocr.DdddOcr()
with open('code.png', 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)