【python】基于cv2提取图片上的文本内容

本文记录了使用Python复制图片上文本内容的方法。利用cv2模块进行处理,介绍了引入库和读入数据的使用步骤,还提到运行可能报错,需下载Tesseract - OCR,并根据具体情况修改文件目录。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

python系列文章目录



前言

Mark使用python过程中的一些记录。


一、如何复制图片上的文本内容

可以利用python进行处理,使用cv2这个模块。

二、使用步骤

1.引入库

代码如下(示例):

# coding: utf-8
import cv2
import pytesseract
import datetime
import time

2.读入数据

代码如下(示例):

# 设置tesseract可执行程序及中文字库的路径
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract'
tessdata_dir_config = r'--tessdata-dir "C:\Program Files (x86)\Tesseract-OCR\tessdata"'
img = cv2.imread("需要识别图片的位置")
text = pytesseract.image_to_string(img,config=tessdata_dir_config)
f= open('图片文字导出的位置','r+')
f.read()
now_time=str(datetime.datetime.now())
f.write(now_time)
f.write('\n')
for i in text:
    f.write(i)
f.write('\n')
f.close()

总结

把该import的包都装好;运行可能会报错,下载个Tesseract-OCR。#tesseract_cmd = ‘tesseract’,在目录\python\Lib\site-packages\pytesseract下找到pytesseract,然后将

tesseract_cmd = 'tesseract'
#改为
tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

其中文件目录根据具体情况而定。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值