发票数据识别

该博客介绍了使用OpenCV和Python进行图像处理,提取发票上的文字。通过缩放、灰度处理、二值化、膨胀、轮廓检测等步骤,定位并分割文字区域。最后,对分割出的文字区域进行识别。
import cv2
import math
import numpy as np
import matplotlib.pyplot as plt
import skimage
from PIL import Image
from pytesseract import pytesseract
from skimage import data,color,morphology,feature
import argparse
#import cvHelper

# 原始图像
img_ori1 = cv2.imread('TestData/taxi/IMG_3.JPG')


imgs = [img_ori2]
resize_imgs = []
gray_resize_imgs = []

# 缩放图像
for idx,im in enumerate(imgs):
    width = 300.0          # 缩放 目标宽度
    r = width/im.shape[1] # 缩放因子
    dim = (int(width), int(im.shape[0]*r))
    img_resized = cv2.resize(im, dim, interpolation=cv2.INTER_AREA)
    resize_imgs.append(img_resized)
    gray = cv2.cvtColor(img_resized, cv2.COLOR_BGR2GRAY)
    gray_resize_imgs.append(gray)

# 显示图像
import pylab
cv2.namedWindow("ori img", cv2.WINDOW_AUTOSIZE)
cv2.moveWindow('ori img', 20, 24)
cv2.imshow('ori img', resize_imgs[0])
pylab.show()

im_at_mean = cv2.adaptiveThreshold(gray_resize_imgs[0], 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV, 3, 5)
cv2.imshow("im_at_mean", 
一、基础信息 数据集名称:发票字段检测数据集 图片数量: - 训练集:393张图片 - 验证集:89张图片 - 测试集:45张图片 - 总计:527张发票相关图片 分类类别: - 账单地址(Billing Address) - CIN号码(CIN number) - 折扣(Discount) - 到期日期(Due Date) - 消费税(GST) - 消费税识别号(GSTIN) - 发票日期(Invoice Date) - 发票描述(Invoice Description) - 发票号码(Invoice Number) - 净额(Net Amount) - 客户名称(Party name) - 服务费(Service charges) - 送货地址(Shipping Address) - 送货费(Shipping charges) - 预扣税(TDS) - 应税金额(Taxable Amount) - 总金额(Total Amount) 标注格式:YOLO格式,包含边界框和类别标签,适用于目标检测任务。 数据来源:来源于真实发票文档图像,支持关键字段的定位与识别。 二、适用场景 1. 自动化发票处理系统开发: 数据集支持目标检测任务,帮助构建AI模型自动提取发票中的关键字段(如金额、日期、地址),用于财务软件或ERP系统,实现高效数据录入和错误减少。 1. 财务与会计AI应用: 集成至企业报销工具或审计系统中,提供实时字段识别功能,自动化发票分类、验证和报告生成,提升业务流程效率。 1. 文档智能研究: 支持计算机视觉与文档处理的交叉研究,助力学术论文在OCR、表格理解或结构化数据提取领域的创新。 1. 企业流程优化工具: 适用于物流、零售或制造业的发票管理解决方案,通过AI模型快速解析大量发票,优化供应链和财务操作。 三、数据集优势 1. 精准标注与高覆盖性: 所有图片均标注YOLO格式边界框,确保字段定位精确;覆盖17个关键发票字段,包括地址、金额、税务等,全面反映真实业务场景。 1. 任务适配性强: 数据直接兼容主流目标检测框架(如YOLO),支持端到端模型训练;适用于从字段检测扩展到文档分类或信息提取等多任务需求。 1. 实际应用价值突出: 专注于发票核心字段的识别,减少人工干预,提升数据处理速度和准确性;样本来源于多样化发票类型,增强模型在真实环境中的泛化能力。 1. 即用性与效率: 标注格式标准化,便于快速集成到现有AI流水线;数据集规模适中但高度聚焦,能有效支持模型迭代和部署。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值