RUN_1991-优快云博客

原创 2024 惊爆！RSL-SQL 框架颠覆文本到 SQL 生成领域，准确率惊人

在人工智能的文本到 SQL 生成领域，RSL-SQL 框架脱颖而出。它针对模式链接存在的风险，创新地结合双向模式链接、上下文信息增强、二元选择策略与多轮自校正。在 BIRD 和 Spider 基准测试中，展现出卓越性能，使用 GPT-4o 时， BIRD 上执行准确率达 67.2%， Spider 上达 87.9%，且成本效益佳。通过消融研究证实各组件有效性，其代码已开源。该框架不仅提升了文本到 SQL 生成的准确性和效率，还为相关研究提供了新方向，推动了该领域发展。

2025-01-02 20:07:43 913

原创 XiYan-SQL：⼀种多⽣成器集成的Text-to-SQL框架

本文提出 CYCLESQL 迭代框架，旨在解决 NL2SQL 中现有模型首次尝试时准确率低的问题。它引入基于数据的自然语言解释作为反馈，通过追踪数据来源、丰富语义、生成解释并验证翻译来优化结果。实验表明，CYCLESQL 显著提升了多个模型在多数据集上的翻译准确性，在执行和测试套件准确性方面表现突出，还通过定性评估证明了其解释对用户理解翻译过程有帮助，为 NL2SQL 研究提供了新方向。

2024-12-03 19:41:28 1311

原创李飞飞：Agent AI 多模态交互的前沿探索

Agent AI在多模态交互方面展现出巨大潜力，通过整合各类技术，在游戏、机器人、医疗等领域广泛应用。如游戏中优化NPC行为，机器人领域实现多模态操作等。然而，其面临数据隐私、偏见、可解释性等问题。未来，需加强技术创新，改进算法提升性能，解决伦理问题，推动跨领域融合，以实现Agent AI的持续发展，为社会带来更多积极影响。本文只对关键信息做了阐述，大佬的文档最好还是阅读下原文，原文信息更丰富。看不懂英文的小伙伴也不用着急，关注公众号后回复李飞飞获取第一手英文翻译稿，爽到飞起。

2024-12-03 15:52:23 1377

原创 ZeroNL2SQL：零样本 NL2SQL

自然语言到 SQL（NL2SQL）的转换是一个重要的研究领域，它允许非技术用户轻松访问和分析数据，在商业智能、数据分析等领域具有广泛的应用前景。然而，现有的 NL2SQL 方法在面对新的数据库、新的语言现象或 SQL 结构时，往往表现出性能下降的问题。为了解决这一问题，本文研究零样本 NL2SQL，旨在构建一个能够适应各种测试环境的 NL2SQL 模型，而不需要来自测试环境的标注样本。

2024-10-30 10:10:25 1149

原创 CodeS：构建用于文本到 SQL 的开源语言模型

语言模型在将自然语言问题转换为 SQL 查询（文本到 SQL ）的任务中显示出良好的性能。然而，大多数最先进的（SOTA）方法都依赖于强大但闭源的大型语言模型（LLM），例如 ChatGPT 和 GPT-4，这些模型可能存在模型架构不明确、数据隐私风险和昂贵的推理开销等局限性。为了解决这些限制，我们引入了 CodeS ，这是一系列预先训练的语言模型，参数范围从 1B 到 15B，专为文本到 SQL 任务而设计。 CodeS 是一种完全开源的语言模型，它以小得多的参数大小实现了卓越的准确性

2024-10-30 10:00:24 1626

原创 PURPLE：让大语言模型成为更好的SQL编写者

随着自然语言处理技术的发展，将自然语言转换为结构化的数据库查询（即NL2SQL）已经成为连接人类与数据的关键桥梁。然而，在实际应用中，即使是最先进的大语言模型（LLM）也常常在生成复杂的SQL语句时遇到困难。为了克服这一挑战，复旦大学的研究团队提出了一个名为 PURPLE 的新框架，该框架通过检索包含所需逻辑运算符组合的示例来指导大语言模型产生更准确的SQL。

2024-10-16 11:09:02 1189

原创阿里 DAIL-SQL：大型语言模型支持的文本到 SQL：基准评估

本文深入探讨了基于大型语言模型（LLMs）的 Text-to-SQL 任务的相关研究。通过对现有提示工程方法进行系统比较，阐述了不同方法在问题表示、示例选择和示例组织方面的优缺点，并基于此提出了一种新的集成解决方案 DAIL-SQL，该方案在 Spider 排行榜上取得了 86.6% 的执行准确率，刷新了纪录。同时，还研究了开源 LLMs 在 Text-to-SQL 任务中的潜力以及监督微调对其性能的影响，并强调了提示工程中的标记效率问题。

2024-10-16 11:02:56 1367

原创复旦大学 PURPLE：让大语言模型成为更好的SQL编写者

为了解决上述问题，本文提出了 PURPLE 方法。PURPLE 旨在通过检索包含必要逻辑运算符组合的示例来提高 NL2SQL 任务的准确性，从而引导 LLM 生成更好的 SQL 翻译。

2024-10-10 20:16:40 1328

原创自然语言到 SQL 的曙光：我们准备好了吗？

在当今数字化时代，将用户的自然语言问题转换为SQL查询（nl2sql）对于降低访问关系数据库的门槛具有重要意义。随着大型语言模型（LLM）的出现，nl2sql任务的性能得到了显著提升，但这也引发了一个关键问题：我们是否已经完全准备好在生产环境中部署nl2sql模型？

2024-10-08 16:33:34 1696 2

原创智能扩展：通过小型模型初始化加速大型语言模型预训练

本文介绍的HyperCloning是一种新颖的初始化策略，它可以将权重从较小的预训练源模型转移到较大的目标模型，过程简单有效且保留模型功能。通过这种方法，在语言模型训练中实现了更快的收敛和更好的最终准确性，实验中加速比达到2 - 4倍。同时，通过消融研究探索了源模型架构和不同权重克隆技术对目标模型收敛的影响。

2024-09-26 10:03:43 744

原创探索LLM中的CoT链式推理：ECHO方法深度解读

本文通过深入解读《Self-Harmonized Chain of Thought》论文中的ECHO方法，详细阐述了其创新点、工作流程以及实验结果。ECHO方法通过自我协调机制将多样化的演示统一成一个通用的推理模式，有效解决了现有CoT方法中的诸多挑战。

2024-09-24 11:37:16 497

原创个性化大语言模型：PPlug——让AI更懂你

在当今数字化转型的时代，大型语言模型（LLMs）已经成为了不可或缺的工具，它们在自然语言理解、生成和推理方面展现了非凡的能力。然而，这些模型普遍采用的是“一刀切”的方式，即对于相同的输入给予所有用户相似的响应。这种方式虽然能够满足大多数情况下的需求，但在需要根据个人偏好定制内容的情境下就显得力不从心了。为了解决这个问题，来自中国人民大学高瓴人工智能学院与百度公司的研究团队提出了一种名为PPlug的新颖个性化LLM模型。

2024-09-24 10:49:24 1406

原创 GraphRAG与VectorRAG我都选：HybridRAG

从金融应用中产生的非结构化文本数据（如财报电话会议记录）提取和解释复杂信息，即使采用当前最佳实践使用检索增强生成（RAG）技术，对于大型语言模型（LLMs）来说仍存在重大挑战。这些挑战包括领域特定术语和文档格式的复杂性。本文介绍了一种称为 HybridRAG 的新方法，它结合了基于知识图谱（KGs）的RAG技术（称为GraphRAG）与VectorRAG技术，以提高从金融文件中提取信息的问答系统性能，并能够生成准确且上下文相关的答案。

2024-09-19 10:03:52 1639

原创 AgentRE：用智能体框架提升知识图谱构建效果，重点是开源！

在复杂场景中，关系抽取 (RE) 因关系类型多样和实体间关系模糊而挑战重重，影响了传统 "文本输入，文本输出" 语言模型的性能。为此，我们提出了基于代理的 RE 框架 AgentRE，该框架通过整合大型语言模型的记忆、检索和反思能力，有效应对这些挑战。AgentRE 包含三大模块，助力代理高效获取并处理信息，显著提升 RE 性能。实验表明，AgentRE 在低资源环境下表现卓越，并能生成高质量训练数据，用于优化小型模型。

2024-09-13 09:50:45 1065

原创 Agent四大范式 | 综述：全面理解Agent工作原理

随着大型语言模型（LLMs）展现出显著的智能，将其应用于自主代理规划模块的研究受到了广泛关注。本综述首次系统性地审视了基于 LLM 的代理规划，涵盖了提升规划能力的最新研究成果。我们对现有的 LLM-代理规划研究进行了分类，将其分为任务分解、计划选择、外部模块、反思和记忆等类别，并针对每个方向进行了深入分析。同时，我们也探讨了该研究领域面临的挑战。

2024-09-12 10:13:44 852

原创又来一个RAG：RankRAG，英伟达RAG新思路

我们提出了一种名为 RankRAG 的创新指令微调框架，该框架使单个 LLM 能够同时进行上下文排序和答案生成，显著提升了 RAG 的性能。通过在训练中融入少量排序数据，RankRAG 不仅超越了专门优化的排序模型，还在生成任务上表现卓越，击败了包括 GPT-4 在内的多个顶尖模型。特别是在知识密集型和生物医学领域的基准测试中，RankRAG 展现了其强大的泛化能力，无需特定领域的微调即可与 GPT-4 媲美。

2024-09-12 09:30:36 1048

原创 HomeDepot：RAG能否在提高客服实际效率？ReACT推理是否有帮助？

RAG based Question-Answering for Contextual Response Prediction System大型语言模型 (LLM) 在多种 NLP 任务中表现出色，尤其在问答系统方面潜力巨大。然而，在行业应用中，为了提供精准且相关的信息，LLM 需要依赖全面的知识库，以避免信息失真。检索增强生成 (RAG) 技术应运而生，成为解决这一难题的希望。但利用 RAG 构建实际应用中的问答框架，仍面临三大挑战：数据获取难、生成内容质量评估难、人工评估成本高。本文提出一个端到端框架，

2024-09-11 11:32:40 763

原创下一代RAG：MemoRAG

MemoRAG是一个建立在高效、超长记忆模型之上的创新 RAG（Retrieval-Augmented Generation）框架，由智源研究院（北京人工智能研究院）与中国人民大学高瓴人工智能学院联合推出并开源。MemoRAG：通过记忆启发的知识发现迈向下一代RAG，为 RAG 提供基于内存的数据接口，适用于多种用途的应用程序！

2024-09-11 11:14:04 1771

原创 RB-SQL：利用检索LLM框架处理大型数据库和复杂多表查询的NL2SQL

利用密集型段落检索（Dense Passage Retrieval, DPR）模型来检索相关表格、列和示例，以构建有效的提示工程。此外，框架还引入了SQL骨架作为示例组织中的中间步骤，以指导正确的SQL生成过程。表格检索器从数据库中筛选表格，列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例，并将SQL框架添加到示例组织中。：搜索具有相似SQL骨架的少量示例，并将SQL骨架引入示例组织，以增强上下文学习过程。该模块计算问题与表格之间的相似度，并检索与问题高度相关的表格。(b) 列检索器的框架。

2024-09-10 10:30:51 794

原创新鲜出炉2个RAG技巧，高级RAG更高级！

上周比较火的2个内容，一个是 JinaAI 发布的一个关于 late chunking 的博客，另外一个是英伟达最新挂出来的 RAG-OP 的论文。2个都能让已有的 RAG 系统召回测有一个比较不错的提升，并且实现都非常容易。

2024-09-10 10:20:35 575

原创 GoogleSQL：SQL 中的 Pipe 语法

SQL 长期以来一直是结构化数据处理的主导语言，通过本文，GoogleSQL 团队引入了一种新的管道结构化数据流语法，该语法显著提高了 SQL 的可读性、可扩展性和易用性。

2024-09-06 11:05:55 1280

原创南大与微软EfficientRAG：迭代分解Query提升多跳问答效果！

多跳问答是一类复杂的查询，需要通过多步骤推理来找到答案，这通常超出了单个信息检索回合能够提供的信息范围。为了解决复杂问题，南大与微软提出EfficientRAG，它由两个轻量级组件构成：Labeler & Tagger和Filter。这两个组件都作为标记级别的分类器，用于识别和过滤信息。

2024-09-05 09:35:55 739

原创一篇大模型NL2SQL全栈技术最新综述

随着LLM的出现，NL2SQL的性能得到了极大的提升，这显著降低了访问关系数据库的障碍，并支持各种商业应用。本文提供了一个全面的NL2SQL技术综述，覆盖了整个生命周期，包括模型、数据、评估和错误分析四个方面。

2024-09-04 17:17:14 1162

原创 Tool-SQL：基于Agent智能体的Text2SQL解决方案，显著提升Text2SQL效果

近期，Text-to-SQL 技术通过整合数据库系统的反馈，有效利用了大型语言模型（LLMs）。尽管这些技术能有效纠正 SQL 查询的执行错误，但在处理数据库不匹配问题上仍显不足这类问题不会引发执行异常。为此，我们设计了一个辅助工具框架，包括检索器和检测器，专门用于诊断并修正 SQL 查询中的不匹配问题，从而提升 LLM 在实际应用中的查询处理能力。

2024-09-04 10:02:01 1975 3

原创前沿重器[54] | 聊聊搜索系统7：补充模块

RAG在整个大模型技术栈里的重要性毋庸置疑，而在RAG中，除了大模型之外，另一个不可或缺的部分，就是搜索系统，大模型的正确、稳定、可控生成，离不开精准可靠的搜索系统，大量的实验中都有发现，在搜索系统足够准确的前提下，大模型的犯错情况会骤然下降，因此，更全面、系统地了解搜索系统将很重要。

2024-08-29 10:03:17 109 1

原创前沿重器[55] | prompt综述的解释和个人思考

上周手上不太方便，即使后续好了也没有搞定（不过说实话，这篇文章的量似乎没读完也不好搞定）。最近是有3篇prompt的综述非常出名：每篇综述的内容都比较丰富，尤其是第一篇，已经到了76页，然而从综述角度，需要把尽可能完善地把研究领域内的关键文章都给说明白，然而从应用角度或者学习角度，从中能找到适合自己的部分，快速过滤和筛选则更为重要，今天这篇文章，是综合上述3篇综述的内容以及个人在实际应用中的经验，从中抽取可靠的方案和思路总结。

2024-08-29 09:56:24 413

原创 CDH6.2调优总结

集群搭建完成后，性能调优是必不可少的，调优分为硬件调优、组件调优、任务调优，本文档将这三部分调优的内容进行穿插讲解，是最全面的大数据调优文档，用了的都说爽，非常 nice ！！！

2024-02-08 15:00:00 1208

原创 CDH软硬件配置建议（Cloudera 官方）

基于cdh的官方软硬件配置建议，用于搭建hadoop大数据集群前期的硬件规划以及组件角色规划，根据官方大哥的思路做规划肯定能够保证不出错，非常 nice！

2024-02-08 14:00:00 349

原创大数据平台硬件选型

在部署大数据平台前，需要做的最重要的一部分公司就是硬件服务器的选型，这部分一定要根据业务的实际情况来选择不同的服务器，原则是既能满足未来三年的业务发展也要尽可能的缩减成本，硬件服务器可考虑自建IDC或用云服务器，本方案是以自建服务器为前提的，本教程可以让你理解选型的方案以及目标，非常 nice ！！

2024-02-07 16:34:51 730

原创 CDH6.2 在线扩容

当你大数据集群的规模已经无法满足当前数据需求时，就需要在线对集群进行扩容，该文章从头到尾手把手教你如何扩容 hadoop 集群，跟着我来做非常 nice！！！

2024-02-07 15:47:28 1289

原创手把手教你离线搭建CDH6.2

基于自建 parcels 的方式进行CDH6.2的大数据集群搭建，手把手教你安装，亲测可用，从基础的系统环境搭建、参数优化、硬件划分原则到后期的使用维护及日常运维，应有尽有，是我工作中的实战，后续还会不断维护，请参照下面的步骤实现，非常nice！！！

2024-02-07 13:57:00 1628 1

原创 LVM磁盘管理

使用LVM进行服务器的磁盘管理，让你的磁盘无限扩容，请参照下面的步骤实现，非常nice！！！为便于今后对磁盘的扩展，及统一管理，建议在LINUX操作系统增加硬盘时采用LVM进行管理，同时各分区使用XFS格式。

2024-01-07 18:24:34 711

原创 Centos7 离线搭建 NTP服务

在配置时钟同步服务器时第一次同步时间时，使用ntpdate命令；后续通过ntpd服务与服务器同步时间。一、搭建NTP服务器1、查看服务器、客户端操作系统版本[root@web ~]# cat /etc/redhat-releaseCentOS Linux release 7.5.1804 (Core)2、查看服务器是否安装ntp，系统默认安装ntpdate；...

2019-08-16 11:26:28 2638

AwaysLine