本文是LLM系列文章,针对《HGT: Leveraging Heterogeneous Graph-enhanced Large Language Models for Few-shot Complex Table Understanding》的翻译。
摘要
表理解(TU)已经取得了可喜的进展,但它面临着手动标记表的稀缺性和复杂表结构的存在等挑战。为了应对这些挑战,我们提出了HGT,这是一个具有异构图(HG)增强的大型语言模型(LLM)的框架,用于处理少量TU任务。它通过软提示和指令转向将表语义与LLM的参数知识对齐来利用LLM,并通过涉及三个新的多粒度自监督HG预训练目标的多任务预训练方案来处理复杂的表。我们实证证明了HGT的有效性,表明它在几个基准上优于SOTA的小样本复杂TU。
1 引言
2 相关工作
3 任务定义
4 方法
5 实验
6 结论
在本文中,我们介绍了一种新的框架,即HGT,它是为小样本复杂TU量身定制的。在CTC、TTC和表QA的多个数据集上验证了HGT的有效性,并进行了深