自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 【论文】CHASE-SQL: Multi-Path Reasoning and Preference Optimized Candidate Selection in Text-to-SQL

在解决大型语言模型(LLM)在Text-to-SQL任务中的表现问题时,我们提出了CHASE-SQL,这是一个新的框架,采用创新策略,通过在多代理建模中使用测试时计算来改善候选生成和选择。CHASE-SQL利用LLM的内在知识,采用不同的LLM生成器生成多样化且高质量的SQL候选,具体方法包括:(1)通过分治方法将复杂查询分解为可管理的子查询,从而在单次LLM调用中生成查询;(2)基于查询执行计划的推理链,反映数据库引擎在执行过程中采取的步骤;

2025-02-26 21:43:00 761

原创 【论文】SCIAGENTS: AUTOMATING SCIENTIFIC DISCOVERY THROUGH MULTI-AGENT INTELLIGENT GRAPH REASONING

在不断演变的科学发现领域中,一个重大挑战是寻找方法来建模、理解和利用从多种来源挖掘的信息,以此作为进一步研究进展和新科学发现的基础。传统上,这一直是人类研究人员的领域,他们回顾背景知识,草拟假设,通过各种方法评估和测试这些假设,并根据发现进行改进。尽管这些传统方法在科学历史上带来了突破,但它们受到研究人员的创造力和背景知识的限制,可能将发现的范围局限于人类想象的边界。

2024-12-05 21:33:28 868

原创 CHESS论文的一些小细节

5.column filtering:从全部数据开始筛选,根据entity_retrieval的similar_value还有问题和evidence的信息挨个询问列是否是相关的,排除掉所有明显不相关的列并获得思维链,然后将entity_retrieval中similar_columns的列加入并且将所有表连接的外键加入。2.实体检索(entity retrieval):更灵活的搜素方法-编辑距离相似度量,提高检索效率的方法-基于局部敏感哈希(LSH)的语义相似度度量的分层检索策略见附录c。

2024-10-28 13:52:29 1143

原创 【学习笔记7】论文C3: Zero-shot Text-to-SQL with ChatGPT

本文提出了一种基于 ChatGPT 的 zero-shot Text-to-SQL 方法,称为 C3,在 Spider 的保留测试集上达到了 82.3% 的执行准确率,成为 Spider Challenge 中最新的 zero-shot Text-to-SQL 方法。C3 包含三个关键组件:清晰提示(Clear Prompting, CP)、带提示的校准(Calibration with Hints, CH)和一致输出(Consistent Output, CO),分别对应模型输入、模型偏差和模型输出。

2024-10-28 10:24:57 1011

原创 【学习笔记6】论文SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive LLM Synergy

Text-to-SQL 转换是一项关键创新,简化了从复杂 SQL 语句到直观自然语言查询的转换,尤其在 SQL 在各类岗位中广泛应用的情况下,这一创新显得尤为重要。随着 GPT-3.5 和 GPT-4 等大型语言模型(LLMs)的兴起,这一领域得到了极大的推动,提供了更好的自然语言理解能力和生成细致入微的 SQL 语句的能力。然而,在 Text-to-SQL 应用中,开源 LLMs 的潜力尚未得到充分挖掘,许多框架未能充分利用其能力,特别是在处理复杂数据库查询和结合反馈进行迭代优化方面。

2024-08-13 10:26:46 1575

原创 【学习笔记5】MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL Generation

最近在大型语言模型(LLMs)方面的进展使基于上下文学习(ICL)的方法在Text-to-SQL任务中显著优于微调方法。然而,在包含复杂模式和查询的基准测试中,例如BIRD,它们的性能仍然远低于人类专家。本研究考虑了LLMs对提示的敏感性,并提出了一种新方法,该方法利用多个提示来探索更广泛的可能答案搜索空间并有效地汇总它们。具体而言,我们通过使用多个提示的模式链接稳健地优化数据库模式。随后,我们根据优化后的模式和多样化的提示生成各种候选SQL查询。

2024-08-10 10:30:37 1084

原创 【学习笔记4】论文MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL

给定一个数据库模式T ={T,C},选择器agent的目的是找的最小模式S'={T',C'},其中,并结合外部知识K,来回答问题Q。选择器可以描述为:其中,表示提示LLM的选择器的函数。

2024-08-09 08:40:22 1263

原创 【学习日记3】DAIL-SQL论文:Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation

大型语言模型(LLMs)已成为 Text-to-SQL 任务的新模式。然而,缺乏系统的基准测试限制了有效、高效和经济的基于 LLM 的 Text-to-SQL 方案的发展。为了解决这一挑战,本文首先对现有的提示工程方法进行了系统且广泛的比较,包括问题表示、示例选择和示例组织,并详细说明了它们的优缺点。基于这些发现,我们提出了一种新的综合解决方案,名为 DAIL-SQL,它以 86.6% 的执行准确率刷新了 Spider 榜单,并设定了新的标准。

2024-08-08 12:49:25 1769

原创 【学习日记2】BIRD数据集

text-to-SQL 的解析,旨在将自然语言的问题转换成可执行的 SQL,近年来受到越来越多的关注,特别是,GPT-4和 Claude-2在这项任务中已经显示出令人印象深刻的成果。然而,目前大多数流行的基准测试,例如 Spider 和 WikiSQL,专注于具有少量数据库的值和数据库模式,这在学术研究与实际应用之间留下了差距。

2024-08-01 11:41:13 3028 1

原创 论文:DIN-SQL:Decomposed In-Context Learning of Text-to-SQL with Self-Correction

在zero-shot和few-shot下的大模型已经有了足够好的结果,但这些模型在常用的基准测试(比如spider上)仍然落后于设计良好的经过微调的模型,如下图:微调相比于从头开始或微调一个模型,不需要消耗过多的资源,此外在一些基准测试数据集上,few-shot已经展现出较好性能,在训练例子有限的情况下也能有很高准确率。

2024-07-30 20:48:37 979

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除