【论文笔记】Spatial Dual-Modality Graph Reasoning for Key Information Extraction(SDMGR)

本文介绍了用于文档关键信息抽取的SDMGR模型。该模型基于CNN+LSTM+GNN,通过Kronecker product算子融合视觉与文本模态特征,并进行计算量和内存占用优化。在SROIE和WildReceipt数据集上实验效果良好,不过作者认为其抽取性能或不如transformer - based模型。

Spatial Dual-Modality Graph Reasoning for Key Information Extraction

基本信息

  • 论文链接:arxiv
  • 发表时间:2021
  • 应用场景:文档关键信息抽取

摘要

存在什么问题 解决了什么问题
1. 先前的文档关键信息抽取大都不鲁棒(新的模板或者ocr识别结果错误),导致了其泛化性不高的缺陷。 1. 提出了一个端到端文档关键信息抽取模型SDMGR,将文档图像看做成一个双模态图网络,该网络融合了visual以及text信息,进而完成关键信息抽取功功能。并且该网络在泛化性很高,能够直接用于没见过的文档版式的关键信息抽取任务。
2. 提出了一个新的且更具挑战性的用于关键文档信息抽取数据集WildReceipt,包含25中kv,这其中包括了一些易混淆kv对。并且数据量是SROIE的两倍。
3. SDMGR在SROIE以及WildReceipt数据集上均取得了SOTA。

模型结构

image-20220530110414407

背景

对于一个OCR输出框,可以用 r i = < x i , y i , h i , w i , s i > r_i=<x_i,y_i,h_i,w_i,s_i> ri=<xi,y

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值