
AIGC前沿技术追踪
文章平均质量分 89
AIGC前沿技术追踪
RUN_1991
一线架构师,二线农民工,大数据行业出身,最近在搞AI智能问答
展开
-
XiYan-SQL:⼀种多⽣成器集成的Text-to-SQL框架
本文提出 CYCLESQL 迭代框架,旨在解决 NL2SQL 中现有模型首次尝试时准确率低的问题。它引入基于数据的自然语言解释作为反馈,通过追踪数据来源、丰富语义、生成解释并验证翻译来优化结果。实验表明,CYCLESQL 显著提升了多个模型在多数据集上的翻译准确性,在执行和测试套件准确性方面表现突出,还通过定性评估证明了其解释对用户理解翻译过程有帮助,为 NL2SQL 研究提供了新方向。原创 2024-12-03 19:41:28 · 1320 阅读 · 0 评论 -
李飞飞:Agent AI 多模态交互的前沿探索
Agent AI在多模态交互方面展现出巨大潜力,通过整合各类技术,在游戏、机器人、医疗等领域广泛应用。如游戏中优化NPC行为,机器人领域实现多模态操作等。然而,其面临数据隐私、偏见、可解释性等问题。未来,需加强技术创新,改进算法提升性能,解决伦理问题,推动跨领域融合,以实现Agent AI的持续发展,为社会带来更多积极影响。本文只对关键信息做了阐述,大佬的文档最好还是阅读下原文,原文信息更丰富。看不懂英文的小伙伴也不用着急,关注公众号后回复 李飞飞 获取第一手英文翻译稿,爽到飞起。原创 2024-12-03 15:52:23 · 1378 阅读 · 0 评论 -
ZeroNL2SQL:零样本 NL2SQL
自然语言到 SQL(NL2SQL)的转换是一个重要的研究领域,它允许非技术用户轻松访问和分析数据,在商业智能、数据分析等领域具有广泛的应用前景。然而,现有的 NL2SQL 方法在面对新的数据库、新的语言现象或 SQL 结构时,往往表现出性能下降的问题。为了解决这一问题,本文研究零样本 NL2SQL,旨在构建一个能够适应各种测试环境的 NL2SQL 模型,而不需要来自测试环境的标注样本。原创 2024-10-30 10:10:25 · 1150 阅读 · 0 评论 -
CodeS:构建用于文本到 SQL 的开源语言模型
语言模型在将自然语言问题转换为 SQL 查询(文本到 SQL )的任务中显示出良好的性能。然而,大多数最先进的 (SOTA) 方法都依赖于强大但闭源的大型语言模型 (LLM),例如 ChatGPT 和 GPT-4,这些模型可能存在模型架构不明确、数据隐私风险和昂贵的推理开销等局限性。为了解决这些限制,我们引入了 CodeS ,这是一系列预先训练的语言模型,参数范围从 1B 到 15B,专为文本到 SQL 任务而设计。 CodeS 是一种完全开源的语言模型,它以小得多的参数大小实现了卓越的准确性原创 2024-10-30 10:00:24 · 1628 阅读 · 0 评论 -
PURPLE:让大语言模型成为更好的SQL编写者
随着自然语言处理技术的发展,将自然语言转换为结构化的数据库查询(即NL2SQL)已经成为连接人类与数据的关键桥梁。然而,在实际应用中,即使是最先进的大语言模型(LLM)也常常在生成复杂的SQL语句时遇到困难。为了克服这一挑战,复旦大学的研究团队提出了一个名为 PURPLE 的新框架,该框架通过检索包含所需逻辑运算符组合的示例来指导大语言模型产生更准确的SQL。原创 2024-10-16 11:09:02 · 1192 阅读 · 0 评论 -
阿里 DAIL-SQL:大型语言模型支持的文本到 SQL:基准评估
本文深入探讨了基于大型语言模型(LLMs)的 Text-to-SQL 任务的相关研究。通过对现有提示工程方法进行系统比较,阐述了不同方法在问题表示、示例选择和示例组织方面的优缺点,并基于此提出了一种新的集成解决方案 DAIL-SQL,该方案在 Spider 排行榜上取得了 86.6% 的执行准确率,刷新了纪录。同时,还研究了开源 LLMs 在 Text-to-SQL 任务中的潜力以及监督微调对其性能的影响,并强调了提示工程中的标记效率问题。原创 2024-10-16 11:02:56 · 1373 阅读 · 0 评论 -
自然语言到 SQL 的曙光:我们准备好了吗?
在当今数字化时代,将用户的自然语言问题转换为SQL查询(nl2sql)对于降低访问关系数据库的门槛具有重要意义。随着大型语言模型(LLM)的出现,nl2sql任务的性能得到了显著提升,但这也引发了一个关键问题:我们是否已经完全准备好在生产环境中部署nl2sql模型?原创 2024-10-08 16:33:34 · 1698 阅读 · 1 评论 -
智能扩展:通过小型模型初始化加速大型语言模型预训练
本文介绍的HyperCloning是一种新颖的初始化策略,它可以将权重从较小的预训练源模型转移到较大的目标模型,过程简单有效且保留模型功能。通过这种方法,在语言模型训练中实现了更快的收敛和更好的最终准确性,实验中加速比达到2 - 4倍。同时,通过消融研究探索了源模型架构和不同权重克隆技术对目标模型收敛的影响。原创 2024-09-26 10:03:43 · 744 阅读 · 0 评论 -
探索LLM中的CoT链式推理:ECHO方法深度解读
本文通过深入解读《Self-Harmonized Chain of Thought》论文中的ECHO方法,详细阐述了其创新点、工作流程以及实验结果。ECHO方法通过自我协调机制将多样化的演示统一成一个通用的推理模式,有效解决了现有CoT方法中的诸多挑战。原创 2024-09-24 11:37:16 · 499 阅读 · 0 评论 -
个性化大语言模型:PPlug——让AI更懂你
在当今数字化转型的时代,大型语言模型(LLMs)已经成为了不可或缺的工具,它们在自然语言理解、生成和推理方面展现了非凡的能力。然而,这些模型普遍采用的是“一刀切”的方式,即对于相同的输入给予所有用户相似的响应。这种方式虽然能够满足大多数情况下的需求,但在需要根据个人偏好定制内容的情境下就显得力不从心了。为了解决这个问题,来自中国人民大学高瓴人工智能学院与百度公司的研究团队提出了一种名为PPlug的新颖个性化LLM模型。原创 2024-09-24 10:49:24 · 1407 阅读 · 0 评论 -
GraphRAG与VectorRAG我都选:HybridRAG
从金融应用中产生的非结构化文本数据(如财报电话会议记录)提取和解释复杂信息,即使采用当前最佳实践使用检索增强生成(RAG)技术,对于大型语言模型(LLMs)来说仍存在重大挑战。这些挑战包括领域特定术语和文档格式的复杂性。本文介绍了一种称为 HybridRAG 的新方法,它结合了基于知识图谱(KGs)的RAG技术(称为GraphRAG)与VectorRAG技术,以提高从金融文件中提取信息的问答系统性能,并能够生成准确且上下文相关的答案。原创 2024-09-19 10:03:52 · 1648 阅读 · 0 评论 -
AgentRE:用智能体框架提升知识图谱构建效果,重点是开源!
在复杂场景中,关系抽取 (RE) 因关系类型多样和实体间关系模糊而挑战重重,影响了传统 "文本输入,文本输出" 语言模型的性能。为此,我们提出了基于代理的 RE 框架 AgentRE,该框架通过整合大型语言模型的记忆、检索和反思能力,有效应对这些挑战。AgentRE 包含三大模块,助力代理高效获取并处理信息,显著提升 RE 性能。实验表明,AgentRE 在低资源环境下表现卓越,并能生成高质量训练数据,用于优化小型模型。原创 2024-09-13 09:50:45 · 1067 阅读 · 0 评论 -
Agent四大范式 | 综述:全面理解Agent工作原理
随着大型语言模型(LLMs)展现出显著的智能,将其应用于自主代理规划模块的研究受到了广泛关注。本综述首次系统性地审视了基于 LLM 的代理规划,涵盖了提升规划能力的最新研究成果。我们对现有的 LLM-代理规划研究进行了分类,将其分为任务分解、计划选择、外部模块、反思和记忆等类别,并针对每个方向进行了深入分析。同时,我们也探讨了该研究领域面临的挑战。原创 2024-09-12 10:13:44 · 852 阅读 · 0 评论 -
又来一个RAG:RankRAG,英伟达RAG新思路
我们提出了一种名为 RankRAG 的创新指令微调框架,该框架使单个 LLM 能够同时进行上下文排序和答案生成,显著提升了 RAG 的性能。通过在训练中融入少量排序数据,RankRAG 不仅超越了专门优化的排序模型,还在生成任务上表现卓越,击败了包括 GPT-4 在内的多个顶尖模型。特别是在知识密集型和生物医学领域的基准测试中,RankRAG 展现了其强大的泛化能力,无需特定领域的微调即可与 GPT-4 媲美。原创 2024-09-12 09:30:36 · 1048 阅读 · 0 评论 -
HomeDepot:RAG能否在提高客服实际效率?ReACT推理是否有帮助?
RAG based Question-Answering for Contextual Response Prediction System大型语言模型 (LLM) 在多种 NLP 任务中表现出色,尤其在问答系统方面潜力巨大。然而,在行业应用中,为了提供精准且相关的信息,LLM 需要依赖全面的知识库,以避免信息失真。检索增强生成 (RAG) 技术应运而生,成为解决这一难题的希望。但利用 RAG 构建实际应用中的问答框架,仍面临三大挑战:数据获取难、生成内容质量评估难、人工评估成本高。本文提出一个端到端框架,原创 2024-09-11 11:32:40 · 763 阅读 · 0 评论 -
下一代RAG:MemoRAG
MemoRAG是一个建立在高效、超长记忆模型之上的创新 RAG(Retrieval-Augmented Generation)框架,由智源研究院(北京人工智能研究院)与中国人民大学高瓴人工智能学院联合推出并开源。MemoRAG:通过记忆启发的知识发现迈向下一代RAG,为 RAG 提供基于内存的数据接口,适用于多种用途的应用程序!原创 2024-09-11 11:14:04 · 1773 阅读 · 0 评论 -
新鲜出炉2个RAG技巧,高级RAG更高级!
上周比较火的2个内容,一个是 JinaAI 发布的一个关于 late chunking 的博客,另外一个是英伟达最新挂出来的 RAG-OP 的论文。2个都能让已有的 RAG 系统召回测有一个比较不错的提升,并且实现都非常容易。原创 2024-09-10 10:20:35 · 575 阅读 · 0 评论 -
GoogleSQL:SQL 中的 Pipe 语法
SQL 长期以来一直是结构化数据处理的主导语言,通过本文,GoogleSQL 团队引入了一种新的管道结构化数据流语法,该语法显著提高了 SQL 的可读性、可扩展性和易用性。原创 2024-09-06 11:05:55 · 1281 阅读 · 0 评论 -
南大与微软EfficientRAG:迭代分解Query提升多跳问答效果!
多跳问答是一类复杂的查询,需要通过多步骤推理来找到答案,这通常超出了单个信息检索回合能够提供的信息范围。为了解决复杂问题,南大与微软提出EfficientRAG,它由两个轻量级组件构成:Labeler & Tagger和Filter。这两个组件都作为标记级别的分类器,用于识别和过滤信息。原创 2024-09-05 09:35:55 · 743 阅读 · 0 评论