PubTabNet——论文阅读笔记

一. 前景介绍

论文:https://arxiv.org/pdf/1911.10683.pdf ((Image-based table recognition: data, model, and evaluation))
代码:https://github.com/ibm-aur-nlp/PubTabNet (包含数据下载地址)
该论文是2020年IBM的表格识别论文,该论文对之后的表格识别工作有很大的影响。

二. 论文贡献

1. 开源数据集

开源了表格识别的数据集,50多万张表格和对应的标注信息, 数据集介绍,请参考https://www.jianshu.com/p/4801279422ac。

2. 提出表格识别新思路

将表格结构序列化,实现端到端的表格识别。
表格结构序列化:
在这里插入图片描述
算法框架:
在这里插入图片描述

3. 提出更加合理的表格识别评价指标

本文提出基于编辑距离的表格相似度评价指标,数学表达式如下:
在这里插入图片描述
评论:虽然后来百度和平安开源的表格识别方案在测试指标上都超越了该算法,但他们的方法都借鉴了该论文的方法,评价指标也是用的本论文的评价指标。同时,PubTabNet也是目前为止开源数量最多的表格识别数据集。

每天进步一点,欢迎技术交流!!!
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值