python系列文章目录
【python】基于cv2提取图片上的文本内容
前言
Mark使用python过程中的一些记录。
一、如何复制图片上的文本内容
可以利用python进行处理,使用cv2这个模块。
二、使用步骤
1.引入库
代码如下(示例):
# coding: utf-8
import cv2
import pytesseract
import datetime
import time
2.读入数据
代码如下(示例):
# 设置tesseract可执行程序及中文字库的路径
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract'
tessdata_dir_config = r'--tessdata-dir "C:\Program Files (x86)\Tesseract-OCR\tessdata"'
img = cv2.imread("需要识别图片的位置")
text = pytesseract.image_to_string(img,config=tessdata_dir_config)
f= open('图片文字导出的位置','r+')
f.read()
now_time=str(datetime.datetime.now())
f.write(now_time)
f.write('\n')
for i in text:
f.write(i)
f.write('\n')
f.close()
总结
把该import的包都装好;运行可能会报错,下载个Tesseract-OCR。#tesseract_cmd = ‘tesseract’,在目录\python\Lib\site-packages\pytesseract下找到pytesseract,然后将
tesseract_cmd = 'tesseract'
#改为
tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
其中文件目录根据具体情况而定。