【图片识别保存表格】图片文档指定多个识别区域,识别固定位置的文字并导出到Excel,Python5分钟搞定,学会不求人

对于企业和组织来说,他们可能拥有大量扫描的纸质文档存储为图像文件,这些文档可能包含多个部分,不同部分可能涉及不同的信息类别。例如,一份扫描的采购订单可能在不同位置有订单编号、供应商信息、采购物品列表等,通过自定义区域识别,可以更精确地提取这些信息并存储到数据库或 Excel 表格中,方便日后的检索和统计。

以下是使用 Python 和飞桨实现图片文档指定多个识别区域,识别固定位置的文字并导出到 Excel 的详细步骤:

一、开发思路

  1. 使用 tkinter 或 PyQt5 等库开发一个简单的 GUI 界面,让用户可以选择图片文件并自定义识别区域。
  2. 利用飞桨的 PaddleOCR 进行文字识别。
  3. 使用 PIL(Python Imaging Library)对图片进行裁剪,以提取用户指定的区域。
  4. 使用 openpyxl 库将识别结果存储到 Excel 文件中。

二、环境搭建

首先,安装所需的 Python 库:

bash

pip install paddlepaddle paddleocr pillow openpyxl tkinter  # 对于 PyQt5 可使用 pip install PyQt5

三、GUI 界面开发(以 tkinter 为例)

python

import tkinter as tk
from tkinter import filedialog
from tkinter import messagebox
from PIL import Image, ImageTk


class ImageOCRApp:
    def __init__(self, root):
        self.root = root
        self.root.title("Image OCR with PaddleOCR")
        se
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值