【Python • 图片识别】pytesseract快速识别提取图片中的文字

在这里插入图片描述

提示:本文多图,请手机端注意流量。

前言

随着人工智能和计算机视觉技术的快速发展,图片识别技术已经成为现代软件开发中的一个重要方向。无论是自动驾驶、安防监控,还是文档扫描识别,图片识别技术都发挥着至关重要的作用。在这一领域,OCR(Optical Character Recognition,光学字符识别)技术是核心,而Tesseract OCR引擎是目前最为流行和强大的开源OCR引擎之一。

对于Python开发者来说,要实现OCR功能,pytesseract是一个非常便捷的工具。pytesseract是Tesseract OCR引擎的一个Python封装库,它能够将Tesseract的功能轻松地集成到Python程序中。通过pytesseract,我们可以快速提取图片中的文字内容,实现图片识别的功能。

本文将详细介绍如何使用pytesseract快速识别和提取图片中的文字内容。我们将从安装和配置环境开始,然后逐步介绍如何使用pytesseract进行基本的文字识别,最后还将探讨一些优化技巧和高级功能,帮助你更好地掌握这一技术。



一、配置环境

1. 安装python依赖

本程序用到了两个python库,pytesseract和PIL,所以先来安装。

运行以下命令

pip install Pillow
pip install pytesseract 

如果在python中没有报错,说明程序安装成功,
在这里插入图片描述

2. 安装识别引擎

安装完以上两个依赖还需要对应的识别引擎。点击去下载

咱们直接使用5月10号构建的最新版本。
在这里插入图片描述

安装tesseract识别引擎(可跳过)

下载完成后打开程序进行安装,先选择语言,这里选择英语English就行,然后点ok

在这里插入图片描述
接下来就是next,完了点击I Agree同意协议,
在这里插入图片描述
在这里插入图片描述
为所有用户安装,然后点next,如图,
在这里插入图片描述
接下来安装中文的语言包用来识别中文,需要滑到下面,选择中文,我这里横排简体中文和竖排简体中文都选择了,完成后点击next,
在这里插入图片描述
在这里插入图片描述
选择安装路径,建议安装到C盘以外,然后点击next
在这里插入图片描述
这里点击安装install

在这里插入图片描述
等待安装完成
在这里插入图片描述
安装完成后,点击next,再点击finish完成安装,
在这里插入图片描述
在这里插入图片描述

验证是否安装成功

添加环境变量,就是你安装到的那个文件夹路径,直接加到path里面,
在这里插入图片描述
然后在命令行运行tesseract -v,如果和下图一样,说明你已经安装成功了,
在这里插入图片描述

二、使用步骤

1.引入库

from PIL import Image
import pytesseract

2.提取图片文字

将读取图片的一行代码封装为一个函数,

def read_image(name):
    print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))

main函数中直接调用即可,

def main():
    read_image('1657158527412.jpg')

3.运行效果

以以下图片为例,
在这里插入图片描述

运行效果如下,
在这里插入图片描述


总结

本文介绍了tesseract的python调用,也就是pytesseract库,其中还有一些其他的内容并没有涉及,仅涉及到了图片提取文字,如果你对其感兴趣,可以深入探索一下,也希望能和我探讨一下。

完整代码

from PIL import Image
import pytesseract


def read_image(name):
    print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))


def main():
    read_image('img.png')


if __name__ == '__main__':
    main()

评论 73
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

广龙宇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值