Large Language Model for Table Processing: A Survey

828 篇文章

已下架不支持订阅

本文调查了大型语言模型(LLM)在处理表格任务中的应用,涵盖表格问答、事实验证、表格操作和数据分析。研究了指令调优、提示方法和基于代理的策略,同时指出在私有部署、高效推理和开发基准方面面临的挑战。

本文是LLM系列文章,针对《Large Language Model for Table Processing: A Survey》的翻译。

摘要

表通常是二维的,结构化以存储大量数据,在数据库查询、电子表格计算和从web表生成报告等日常活动中至关重要。使用大型语言模型(LLM)自动化这些以表为中心的任务提供了显著的公共利益,引起了学术界和工业界的兴趣。这项调查对表格任务进行了广泛的概述,不仅包括表格问答(表格QA)和事实验证等传统领域,还包括表格操作和高级表格数据分析等新强调的方面。此外,它超越了早期的预训练和微调小语言模型的策略,还包括了LLM使用的最新范式。这里的重点是LLM领域内的指令调优、提示和基于代理的方法。最后,我们强调了几个挑战,从私有部署和高效推理到开发用于表操作和高级数据分析的广泛基准。

1 引言

2 表任务和基准

3 表LLM的分类

4 表格LLM训练

5 提示LLM用于表格任务

6 LLM支持的表代理

7 结论和讨论

本文回顾了表处理任务、基准测试和基于LLM的方法。尽管基于LLM的方法有效地解决了一些表任务,但仍有一些挑战没有得到解决。
使用代理的指令调优可能是私有部署的潜在解决方案。基于开源LLM的基础模型的指令调优提供了一定的优势。表GPT和Lemur等工作展示了指令调优的灵活性,在各种下游任务上取得了值得称赞的结果。这些模型可以私下部署,防止敏感

由于没有提供具体的参考引用内容,无法直接从引用中获取该论文的发表位置。一般来说,可以通过以下几种常见途径查询论文的发表位置: 1. **学术搜索引擎**:如谷歌学术、微软学术等。在搜索框中输入论文标题“REASONING ON GRAPHS: FAITHFUL AND INTER- PRETABLE LARGE LANGUAGE MODEL REASONING”,搜索结果中通常会显示论文发表的期刊、会议等信息。 2. **专业数据库**:根据论文所属领域,使用相关的专业数据库进行搜索,例如IEEE Xplore(电子电气领域)、ACM Digital Library(计算机科学领域)等。 3. **论文预印本平台**:像arXiv等预印本平台可能会有该论文的预印本,其中也可能包含关于后续正式发表位置的信息。 以下是使用Python的`selenium`库结合谷歌学术搜索该论文发表位置的示例代码: ```python from selenium import webdriver from selenium.webdriver.common.by import By import time # 设置Chrome浏览器驱动路径 driver = webdriver.Chrome() # 打开谷歌学术网站 driver.get('https://scholar.google.com/') # 定位搜索框并输入论文标题 search_box = driver.find_element(By.NAME, 'q') search_box.send_keys('REASONING ON GRAPHS: FAITHFUL AND INTER- PRETABLE LARGE LANGUAGE MODEL REASONING') # 模拟按下回车键进行搜索 search_box.submit() # 等待页面加载 time.sleep(5) # 尝试获取论文发表位置信息 try: publication_info = driver.find_element(By.CSS_SELECTOR, '.gs_a').text print("论文发表位置信息:", publication_info) except Exception as e: print("未找到论文发表位置信息:", e) # 关闭浏览器 driver.quit() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值