表格识别个人解决方案

挑战

目前市面上存在一些开源的模型,比如 PaddleOCR,但是此类模型对于商业表格和不规则表格的识别效果差之又差。比如下面是一个海运单的例子,原图和识别效果如下:

最后生成表格的效果也不尽如人意。
请添加图片描述请添加图片描述

尝试过的方案

方案一

通过 TableGeneration 进行表格生成作为训练数据集(预训练模型用的 PaddleOCR 里面的),进行 html 指定和限制,然后用 html 生成相应的 excel 表格

完整项目和部分规则指定我已经上传到我的仓库:https://github.com/qulishen/table_generation

但是通过我实际训练之后,发现模型泛化性较差,只能识别生成的表格形式的表格(相当于只记住了单元格的位置,没有记住划分规则)

方案二(目前认为更可行)

利用 modelscope表格分割框架(比 PaddleOCR 检测效果要好),分割成每一个单元格(返回值是每一个单元格四个点的坐标),然后利用 PaddleOCR 的文字识别模型,对每一个单元格进行文字识别。但是目前 modelscope 没有开源如何将相对位置生成为 excel 表格的代码,因此**本方案只能得到每个单元格的内容以及大概的相对关系,无法生成 excel(如果您有方法,欢迎与我联系)**

我的代码在:https://github.com/qulishen/Table_Recognition
(本项目还实现了一些特殊表格的识别以及多表格版面分析+识别)

期望效果

目前最好实现下述效果的思路(能够生成每一个单元格的相对位置和生成 excel 表格),如果您有其他方案,欢迎与我讨论!
请添加图片描述
请添加图片描述

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值