Python+Tesser-OCR实现图片识别

本文介绍如何使用Python结合Pillow及pytesseract库实现光学字符识别(OCR),包括环境搭建、依赖包安装、语言包配置及具体代码实现过程。文中详细说明了识别流程,并给出了一种简单示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、平台

    win7 ,编译器pycharm or sublime 

二、导包

    导入两个包

    1、Pillow

    2、pytessract

    导包方式有两种:

    1、直接在windows的cmd里面输入命令

         pip install Pillow

         pip insatll pytessract

2、 通过pycharm安装包
在这里插入图片描述

三、安装tesseract-OCR

软件链接:[点击打开链接]

安装遇到如下选择additional language data

选择需要用到的语言包。如中文识别选(chinese(simple))

记下安装目录后面会用到。

在这里插入图片描述

在这里插入图片描述

四、创建程序 xx.py

找到自己的python环境所在位置

我的在E:\environment\python\Lib\site-packages\pytesseract\

在该目录下找到pytesseract.py 打开更改为:
tesseract_cmd=‘C:\Users\Administrator\Desktop\Imagerecognition\Imagerecognition\Lib\site-packages\Tesseract-OCR\tesseract.exe’ #该路径为安装OCR对应的目录

在这里插入图片描述

五、创建一个新的程序,输入如下代码:

from PIL import Image
import pytesseract
image = Image.open(‘7.png’)#输入自己想识别图片的路径
#指定路径,路径为安装的OCR对应的目录
tessdata_dir_config = ‘–tessdata-dir “C:/Users/Administrator/Desktop/Imagerecognition/Imagerecognition/Lib/site-packages/Tesseract-OCR/tessdata”’
text = pytesseract.image_to_string(image,lang=‘chi_sim’,config=tessdata_dir_config)
print(text)

六、运行程序

识别的图片:

在这里插入图片描述

识别的结果:

在这里插入图片描述

六、PS

对于文字清晰的图片的识别度大概有90%以上。缺点是识别的速度不够快。

ps:(该文章是我以前发布过的 账号忘了重新发了一个!)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值