LMDX: LANGUAGE MODEL-BASED DOCUMENT INFORMATION EXTRACTION AND LOCALIZATION

828 篇文章

已下架不支持订阅

LMDX利用大型语言模型进行半结构化文档信息提取,适用于视觉丰富的文档,能提取奇异、重复和分层实体,并在文档中定位。在VRDU和CORD基准上达到新SOTA,具有高数据效率,但资源消耗大。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《LMDX: LANGUAGE MODEL-BASED DOCUMENT INFORMATION EXTRACTION AND LOCALIZATION》的翻译。

LMDX:基于语言模型的文档信息提取与本地化

摘要

大型语言模型(LLM)已经彻底改变了自然语言处理(NLP),提高了许多现有任务的先进性,并展示了涌现能力。然而,LLM尚未成功应用于半结构化文档信息提取,这是许多文档处理工作流程的核心,包括在给定预定义目标模式的情况下从视觉丰富的文档(VRD)中提取关键实体。在该任务中采用LLM的主要障碍是LLM中缺乏布局编码,这对高质量提取至关重要,并且缺乏确保答案不会产生幻觉的基础机制。在本文中,我们介绍了基于语言模型的文档信息提取和本地化(LMDX),这是一种将任意LLM用于文档信息提取的方法。LMDX可以在有和没有训练数据的情况下提取奇异、重复和分层实体,同时提供基础保证并在文档中本地化实体。特别是,我们将LMDX应用于PaLM 2-S LLM,并在VRDU和CORD基准上对其进行评估,树立了新的最先进水平,并展示了LMDX如何能够创建高质量、数据高效的解析器。

1 引言

2 方法

3 评估

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值