python使用OpenCV-Python结合百度图像识别api实现图片中的文字识别

最新推荐文章于 2025-10-27 17:42:16 发布

原创

最新推荐文章于 2025-10-27 17:42:16 发布 · 9.5k 阅读

108 ·

CC 4.0 BY-SA版权

文章标签：

#python #图像识别

本文介绍如何结合OpenCV-Python和百度图像识别API，通过预处理图片来提高文字识别的准确性。步骤包括读取图片转为灰度图，形态学变换，二值化，膨胀和腐蚀操作，筛选文字区域，切分图片并调用API进行文字识别。

上篇文章写了利用百度api实现图像识别提取图片上的文字，但是发现不是那么准确，所以现在结合OpenCV-Python找出图片上的文字，再把需要的文字切分出来，再调用接口识别，这样就会精确很多，附上参考的资料，多不多说，开干。
1.读取文件，并专成灰度图

imagePath = "20190610181452.png"
img = cv2.imread(imagePath)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

原图片
灰度图
2.形态学变换的预处理，得到可以查找矩形的图片

sobel = cv2.Sobel(gray, cv2.CV_8U, 1, 0, ksize = 3)
cv2.imshow('sobel',sobel)
cv2.waitKey()

3.二值化并设置膨胀和腐蚀操作的核函数

#二值化
ret, binary = cv2.threshold(sobel, 0, 255, cv2.THRESH_OTSU+cv2.THRESH_BINARY)
# 设置膨胀和腐蚀操作的核函数
element1 = cv2.getStructuringElement(cv2.MORPH_RECT, (3

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

tang_xiaotang

关注关注

15
点赞
踩
108

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

OpenCV-Python实战（1）——OpenCV简介与图像处理基础

盼小辉丶的博客

08-10

27万+

OpenCV 是一个的跨平台计算机视觉库，可以运行在 Linux、Windows 和 Mac OS 操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成，同时也提供了 Python 接口，实现了图像处理和计算机视觉方面的很多通用算法。在本文中，将介绍 OpenCV 库，包括它的主要模块和典型应用场景，同时使用 OpenCV-Python 实战讲解图像处理基础要点。

python opencv 文字识别_python通过EAST文本检测器使用OpenCV检测图像中的文本

weixin_35073008的博客

03-01

1445

1 场景在python环境下，使用EAST文本检测器使用OpenCV检测自然场景图像中的文本。即通过算法，检测标识出来自然图像中的文字区域。可以检测图像中的文字区域和视频中的文字区域。之后可以截取文字区域图像，再通过OCR算法，检测出文字的内容。检测效果如下：1.png2 官网(1)英文官方地址(2)中文译文地址(3)源码地址(百度网盘)源码项目结构：.├── images│ ├── car_...

3 条评论您还未登录，请先登录后发表或查看评论

3 条评论

YNZL0702 2022.06.19
非常实用的教程；感谢博主

weixin_45041388 2021.12.23
博主你这个切片出来的是一张图片吧，不是图片集？

PyAIGCMaster 2020.08.28
好。

python opencv图像识别_使用python和opencv检测图像中的文本区域

weixin_39553272的博客

11-24

1312

有多种方法可以检测图像中的文本.我建议查看this question here,因为它也可以回答你的情况.虽然它不在python中,但是代码可以很容易地从c转换为python(只需看看API并将方法从c转换为python,而不是很难.当我为自己的单独问题尝试代码时,我自己做了) .这里的解决方案可能不适用于您的情况,但我建议您尝试使用它们.如果我要解决这个问题,我会做以下过程：准备你的形象：如果您...

Python文字识别OCR

最新发布

猿说编程

10-27

991

本文介绍了一种基于DLL封装的OCR文字识别技术方案，支持C++、Python和易语言调用。主要内容包括：1. 提供C++头文件接口说明，包含初始化服务、创建句柄、获取识别结果等功能；2. 展示Python调用示例代码，演示了完整的使用流程；3. 通过银行卡和名片识别效果展示，验证了系统的准确性；4. 列出版本更新日志，显示持续优化的轨迹模拟和OCR功能；5. 提供常见问题解答和云盘下载资源。该方案具有跨平台兼容性，支持多线程，并不断优化识别性能和用户体验。

Python+Opencv识别两张相似图片

weixin_42367071的博客

06-03

2040

文章转载：https://www.aliyun.com/jiaocheng/464559.html default...

python+opencv 图像识别匹配

figo8875的专栏

01-17

1348

安装命令：pip install opencv-python 1.图像模板匹配 #使用matchTemplate对原始灰度图像和图像模板进行匹配 res = cv2.matchTemplate(img_gray,template,cv2.TM_CCOEFF_NORMED) #设定阈值 threshold =0.9 #res大于90% loc是一个坐标数组，[y] [x] 结构 ...

python+opencv图像识别教程整理

feigebabata的博客

10-17

4333

0.opencv-python教程及API（英文） https://opencv-python-tutroals.readthedocs.io/en/latest/index.html 1.图像身份识别一个印度小伙写的一手记事本开发甚吊 https://thecodacus.com/category/opencv/page/2/#.W8b6nc4zaUk 2.圆形检测和满...

精选资源

opencv-python-4.5.5-cp311-cp311-win-amd64.zip

11-23

2. 特征检测：OpenCV可以实现各种特征检测算法，如SIFT（尺度不变特征变换）、SURF（加速稳健特征）、ORB（Oriented FAST and Rotated BRIEF）等，这些特征在物体识别、图像匹配等方面有重要作用。 3. 机器学习与...

opencv-python-4.12.0.88.tar.gz

09-13

此外，由于深度学习模块的整合，opencv-python 4.12.0.88能够利用预训练的深度神经网络进行图像识别或特征提取。深度学习部分的发展为计算机视觉带来了革命性的进步。在opencv-python 4.12.0.88中，深度学习模块...

基于Python与OpenCV-Tesseract实现车牌检测与识别完整教程

06-25

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，它提供了大量的图像处理和分析的函数，广泛应用于图像识别、机器视觉、视频处理等领域。而Tesseract OCR是由HP开发，并由...

基于Python OpenCV实现的图片文字识别 共7页.pdf

04-23

在有些工程中，有时候我们需要对图片文字识别。本文利用Python，调用OpenCV 库，先对图片进行预处理，然后借助Google 开源的Pytesser 对图片文字进行了识别。

如何利用Python识别图片中的文字

09-16

主要给大家介绍了关于如何利用Python识别图片中文字的相关资料，文中通过示例代码介绍的非常详细，对大家学习或者使用Python具有一定的参考学习价值，需要的朋友们下面来一起学习学习吧

OpenCv+Ocr 图片文字识别源码

06-13

使用Qt + Opencv 实现的文字识别的示例，带有文字库，学习一下没毛病

使用OpenCV_python中的DNN,CaffeModel识别图像只需30行代码

11-08

使用OpenCV_python中的DNN,CaffeModel识别图像只需30行代码

详解利用python+opencv识别图片中的圆形（霍夫变换）

01-20

在图片中识别足球先补充下霍夫圆变换的几个参数知识： dp，用来检测圆心的累加器图像的分辨率于输入图像之比的倒数，且此参数允许创建一个比输入图像分辨率低的累加器。上述文字不好理解的话，来看例子吧。例如，如果dp= 1时，累加器和输入图像具有相同的分辨率。如果dp=2，累加器便有输入图像一半那么大的宽度和高度。 minDist，为霍夫变换检测到的圆的圆心之间的最小距离，即让我们的算法能明显区分的两个不同圆之间的最小距离。这个参数如果太小的话，多个相邻的圆可能被错误地检测成了一个重合的圆。反之，这个参数设置太大的话，某些圆就不能被检测出来了。 param1，有默认值100。它是meth

图像识别Python数据分析实战：使用OpenCV进行图像识别

AI天才研究院

08-24

708

作者：禅与计算机程序设计艺术 1.简介概述随着计算机视觉技术的蓬勃发展、智能手机和平板电脑的普及，在现代生活中越来越多的人开始接触到图像技术。图像技术的应用范围无所不包，从医疗影像到保险领域，人脸识别、文字识别、机器人视觉等等都在以极快的速度发展。而对于图像技术的实

OPENCV+PYTHON 文字识别（重点图像透视变换）

huang714的专栏

04-20

1226

# Author：Winter Liu is coming! import cv2 as cv import numpy as np import pytesseract # 预处理，高斯滤波（用处不大），4次开操作 # 过滤轮廓唯一 def contour_demo(img): gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY) gray =...

python 5行代码实现图片中文字识别

T_maker的博客

09-11

4157

python + tesseract 实现图片文字识别 使用python与其拓展库识别文字识别，将图片中的中文输出为字符串：安装python3.6 从githup下载源码安装tesseract，使用setup.py文件安装如果要识别图片中的汉字，需下载汉字模块，然后放在tessdata语言模块中，汉语文字模型下载链接https://github.com/tesseract-ocr/tes...

Python如何读取指定文件夹下的所有图像

weixin_30755393的博客

01-26

3943

（1）数据准备数据集介绍：数据集中存放的是1223幅图像，其中756个负样本（图像名称为0.1~0.756），458个正样本（图像名称为1.1~1.458），其中："."前的标号为样本标签，"."后的标号为样本序号（2）利用python读取文件夹中所有图像 1 ''' 2 Load the image files form the folder 3 input: 4...