
RAG
文章平均质量分 92
X.Cristiano
Talk is Cheap, Show me the Code!
展开
-
LlamaFactory × 多模态RAG × Chat-BI:万字长文探寻RAG进化轨迹,打造卓越专业AI助手
本文详细介绍了如何结合LlamaFactory、多模态RAG和Chat-BI技术,打造专业的AI医学问答系统。文章从基础的RAG(检索增强生成)技术讲起,阐述了其通过检索外部知识库信息提升大模型回答准确性和专业性的原理。接着介绍了多模态RAG的升级,使其能够处理文本、图像、音频等多种模态数据,实现更丰富的交互和更精准的诊断等能力。此外,文章还探讨了多模态与BI(商业智能)的融合,通过构建复杂架构,让系统能够处理医学影像诊断、数据统计、图表生成等多种任务。原创 2025-06-06 23:31:20 · 563 阅读 · 0 评论 -
华为港城 RAG 推理训练新突破:过程监督助力 5k 样本性能超越 90k 模型
城市大学与华为团队提出ReasonRAG框架,突破检索增强生成(RAG)技术瓶颈。针对传统结果监督强化学习在Agentic RAG中存在的探索低效、奖惩模糊等问题,该研究创新性地引入过程监督机制,通过细粒度奖励设计、蒙特卡洛树搜索和自动数据构建三大核心技术,实现了模型推理能力的显著提升。实验显示,ReasonRAG仅用5k训练数据即超越需90k数据的基线模型,在多跳推理和跨领域任务中表现出色。该成果为复杂知识推理任务提供了高效解决方案。原创 2025-06-03 17:22:53 · 783 阅读 · 0 评论 -
蚂蚁TuGraph图数据库行业落地,开启数据处理新“视界”
GraphRAG技术通过结合图数据库与生成式AI,实现更精准的信息检索。TuGraph作为领先的图数据平台,支持高效存储和查询复杂关系数据。GraphRAG利用图结构捕捉实体间关系,相比传统RAG能提供更丰富的上下文和多跳推理能力。其工作流程包括查询扩展、图检索、知识增强和生成优化,特别适合处理复杂问题。这一技术代表了AI搜索领域的重要突破,为知识密集型任务提供了更智能的解决方案。原创 2025-05-26 15:36:00 · 852 阅读 · 0 评论 -
MCP+数据库:RAG检索的“升级版”来了!
本文探讨了一种基于MCP(模型上下文协议)提升大模型检索外部知识精度的方法,相比传统RAG技术效果更优。文章首先分析了RAG技术的局限性,包括检索精度不足、内容不完整等问题。随后介绍了MCP协议作为AI模型与外部交互的开放标准,其核心优势在于统一了不同模型的功能调用接口,降低了开发门槛。通过实际案例展示了MCP如何实现结构化数据的高精度检索,如将自然语言查询转换为数据库查询。随着主流平台对MCP的支持,该协议正成为AI工具调用的行业标准,为开发者提供了更高效的解决方案。原创 2025-05-24 09:45:39 · 1350 阅读 · 0 评论 -
IBM RAG挑战赛冠军方案全流程复盘
在公司年报智能问答比赛中,参赛者需在2.5小时内解析100份PDF年报并构建问答系统,回答100个预设模板问题,答案需注明页码。获胜方案基于RAG系统,增加两个路由器和LLM重排序模块,显著提升效果。RAG开发流程包括解析、数据摄取、检索和回答。解析阶段,选择Docling解析器并用GPU加速,应对PDF复杂格式和表格结构保留挑战。数据摄取阶段,将报告转为Markdown文本并分块存储,提升检索效率。虽未采用表格序列化技术,但展现处理复杂表格潜力。原创 2025-05-22 09:12:05 · 1266 阅读 · 0 评论 -
CCF BDCI基于运营商文本数据的知识库检索(RAG)大赛亚军方案分享
最近参加了CCF BDCI的比赛,获得了A榜第一,B榜第二的成绩。该赛题要求使用运营商相关的文档构建知识库,根据用户问题检索知识库并返回答案所在的文本块。这个赛题对检索要求很高,在检索到正确文本块的情况下还需要精确地找到答案对应的句子。在比赛过程中,我们开发了一系列文本压缩策略,从简单到复杂逐步优化。原创 2025-05-14 18:38:40 · 747 阅读 · 0 评论 -
CCF第七届AIOps国际挑战赛季军分享(RAG)
分享CCF 第七届AIOps国际挑战赛的季军方案,从我们的比赛经历来看,并不会,相反,私域领域问答的优秀效果说明RAG真的很重要历经4个月的时间,从初赛赛道第1,复赛赛道第2,到最后决赛获得季军,这一路我们团队收获了很多实践经验,也结识了不少业界的RAG研究者,受益匪浅。应组委会邀请,本文介绍一下我们EasyRAG方案的亮点和实验结果,欢迎感兴趣的朋友批评指正!原创 2025-05-14 18:33:36 · 1052 阅读 · 0 评论 -
华为 MRAG:多模态检索增强生成技术论文阅读
本文综述多模态检索增强生成(MRAG)技术,其整合多模态数据,显著提升多模态大语言模型(MLLM)性能。传统单模态RAG受限于单模态特性,无法充分利用多模态上下文信息。MRAG扩展RAG框架,实现多模态检索与生成,提升问答系统质量,降低幻觉发生率,在关键场景中表现优于单模态RAG。综述从关键技术组件、数据集、评估方法与指标及现有局限性四大维度梳理研究现状,探讨挑战并提出未来方向,揭示MRAG的革命性潜力,为其发展提供前瞻性视角。原创 2025-04-27 09:18:43 · 1053 阅读 · 0 评论 -
强化学习 + RAG:从零到精通的完整实现指南
我们将通过使用我们自己的强化学习(RL)奖励系统来改进我们最简单的检索增强生成(RAG)模型的实现,从而将事实性查询的检索质量从53%提升到84%。原创 2025-04-13 22:42:15 · 1357 阅读 · 0 评论 -
18种RAG技术的极限挑战:我找到了最优解!
在当前生成式模型与信息检索技术快速发展的背景下,如何有效结合二者,提升问答系统的准确性与实用性成为技术探索的焦点。为了寻找最佳解决方案,我尝试了 18 种不同的 RAG(Retrieval-Augmented Generation)技术,从最基础的方法到复杂的多模型融合。经过大量实验,数据表明 Adaptive RAG 凭借动态调整策略和出色的检索效果,以最高得分 0.86 成为本次实验中的大赢家。原创 2025-04-04 23:25:02 · 1077 阅读 · 0 评论 -
[DeepRetrieval] 用DeepSeek-R1-Zero的思路教会模型怎么用搜索引擎找文本
在RAG相关的工作中,我们深知检索质量是当前的瓶颈。DeepSeek-R1-Zero的“RL from Scratch”模式为我们提供了一种新的思路,即通过大规模强化学习来提升模型的推理能力,而无需监督微调。基于这一思路,我们进行了尝试,直接通过试错来训练LLM进行信息检索,而无需监督数据。原创 2025-03-19 09:10:16 · 1535 阅读 · 0 评论 -
不懂RAG?看完这篇万字长文,你就是专家!
文章首先指出传统语言模型(如 GPT-3)依赖预训练参数、无法动态访问外部知识的局限性,而 RAG 通过结合检索系统与生成模型,能够动态利用外部知识源,生成更准确、实时的答案。接着,文章详细解析了 RAG 的核心组件,包括检索机制(稀疏检索与稠密检索)、生成过程(去噪与推理)以及知识整合方式(输入层、中间层和输出层整合)。此外,文章还介绍了 RAG 的关键步骤,如用户意图理解、知识源解析、知识嵌入、索引、检索、整合、答案生成和知识引用,并探讨了高级 RAG 方法在训练优化、多模态处理、记忆增强和智能推理方面原创 2025-03-18 22:29:49 · 848 阅读 · 0 评论 -
从Graph RAG到DeepSearcher:新一代RAG范式的崛起
本文通过技术分析、与传统RAG对比以及实测展示,深入探讨了DeepSearcher这一开源深度研究工具。文章首先介绍了RAG技术的演进,从传统RAG到GraphRAG,再到DeepSearcher的分层语义理解架构,分析了它们在检索机制、数据组织方式和结果生成方面的差异。接着,通过三种RAG设计模式的实验效果对比,展示了DeepSearcher在处理复杂信息和多层级关系时的优势。最后,文章总结了DeepSearcher的先进性,包括更智能的检索、适应性强、多模态支持和个性化能力,同时也指出了其面临的挑战,如原创 2025-03-16 22:51:49 · 1028 阅读 · 0 评论