本文是LLM系列文章,针对《SheetAgent: A Generalist Agent for Spreadsheet Reasoning and
Manipulation via Large Language Models》的翻译。
SheetAgent:通过大型语言模型进行电子表格推理和操作的泛化代理
摘要
电子表格操作广泛存在于大多数日常工作中,显著提高了工作效率。大型语言模型(LLM)最近被尝试用于自动电子表格操作,但尚未在存在推理挑战的复杂现实任务中进行研究(例如,具有多步骤推理和模糊需求的长期操作)。为了弥补与现实世界需求的差距,我们引入了SheetRM,这是一个基准测试,具有长期和多类别任务,具有由现实挑战引起的依赖推理的操作。为了缓解上述挑战,我们进一步提出了SheetAgent,这是一种利用LLM能力的新型自治代理。SheetAgent由三个协作模块组成:Planner、Informer和Retriever,通过迭代任务推理和反思,在无需人工交互的情况下实现对电子表格的高级推理和准确操作。大量实验表明,SheetAgent在多个基准测试上的通过率比基线提高了20-30%,提高了电子表格操作的精度,并展示了卓越的表格推理能力。项目网站上提供了更多详细信息和可视化效果。

订阅专栏 解锁全文
1528

被折叠的 条评论
为什么被折叠?



