本文是LLM系列文章,针对《Instruct and Extract: Instruction Tuning for On-Demand Information Extraction》的翻译。
摘要
具有指令跟随功能的大型语言模型为更广泛的用户群体打开了大门。然而,当涉及到信息提取(自然语言处理中的经典任务)时,大多数特定于任务的系统无法很好地与非专家用户的长尾特别提取用例保持一致。为了解决这一问题,我们提出了一种新的范式,称为按需信息提取,以满足现实世界用户的个性化需求。我们的任务旨在按照说明从相关文本中提取所需内容,并以结构化表格格式呈现。表标题可以是用户指定的,也可以是模型根据上下文推断的。为了促进这一新兴领域的研究,我们提出了一个名为InstructionIE的基准,包括自动生成的训练数据和人工注释的测试集。在Instructionie的基础上,我们进一步开发了一个按需信息提取器ODIE。对我们基准的全面评估表明,ODIE大大优于现有的类似规模的开源模型。我们的代码和数据集发布于https://github.com/yzjiao/On-Demand-IE.
1 引言
2 相关工作
3 INSTRUCTIE数据集
4 实验
5 结论
本文介绍了一项新任务,即按需信息提取,通过根据指令提取内容,并将其组织在具有用户指定或模型推断标题的表中,来满足用户的个性化需求。为了对这项新任务进行基准测试,我们构建了一个全面的数据集Instructionie,包括合成的训练数据和人工注释的
本文提出了一种新的信息提取范式——按需信息提取,利用指令调优的大型语言模型满足用户个性化需求。为此,创建了InstructionIE基准数据集并开发了ODIE模型,该模型在信息提取任务中表现出色。尽管存在模型大小、数据约束等局限性,但研究为按需信息提取任务提供了重要进展。
已下架不支持订阅
4459

被折叠的 条评论
为什么被折叠?



