文章主要内容和创新点
主要内容
本文提出了一个基于大语言模型(LLM)和编程的表格推理框架TableReasoner,用于解决表格问答(TQA)任务。TQA任务因真实世界表格数据的大尺寸、列语义不完整、实体歧义等特点面临挑战。TableReasoner通过以下核心设计应对这些问题:
- 表格Schema表示:采用结合结构和语义的表格schema(而非传统的CSV/Markdown格式),实现对大型表格的整体理解和高效处理;
- 多步Schema链接:通过“解析-链接-细化”流程,从全局schema中提取与查询相关的聚焦schema,减少歧义并缓解模型幻觉;
- 迭代思维架构:借鉴ReAct范式,将推理流程整合到“思考-行动-观察”循环中,支持思考、推理和反思的增量迭代;
- 编程辅助推理:利用Program-of-Thoughts(PoT)生成代码并执行,减少数值推理中的幻觉;
- 性能验证:该框架在SemEval-2025 Task 8的两个子任务(基于DataBench和DataBench Lite)中均获第一名,且在不同规模表格、不同类型问题上表现稳定。
创新点
- 表格Schema表示:通过结构(数据类型、统计属性)和语义(列描述)结合的schema建模表格,解决了传统格式处理大型表
TableReasoner框架提升表格推理能力

订阅专栏 解锁全文
422

被折叠的 条评论
为什么被折叠?



