大模型- 检索增强七宗罪

原创

已于 2024-02-17 16:18:08 修改 · 1.2k 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#AI #大模型 #检索增强 #RAG

于 2024-02-17 16:12:53 首次发布

前言

地址：https://arxiv.org/pdf/2401.05856.pdf 标题：Seven Failure Points When Engineering a Retrieval Augmented Generation System

这篇论文介绍了如何设计一个检索增强生成系统（RAG），作者通过对三个不同领域的案例研究，总结了七个失败点并提出了相关建议。此外，作者还指出了验证RAG系统只能在运行期间完成以及其鲁棒性随时间推移而不断发展的两个关键要点。最后，作者列出了关于RAG系统的研究方向，以供软件工程社区参考。

问题

RAG系统中，容易造成失败的7个点，已经在红色框中标出

FP1 缺失的内容

内容信息缺失情况下系统的无中生有，在询问不能从现有文档中回答的问题时。在理想情况下，RAG 系统会以“抱歉，我不知道”之类的拒绝响应。然而，对于与内容相关但没有答案的问题，系统可能无中生有。

FP2 高度相关的文档没有被找到

问题的答案在文档中，但排名没有高到足以返回给用户。在实践中，优化排序算法，并返回前K个文档。

FP3 不在上下文中

数量限制，从数据库中检索到包含答案的文档，但因为返回的数量多，会出现没有进入生成答案的上下文。

FP4 没有提取出来

答案在上下文中给出，但大型语言模型未能正确提取出答案。通常这种情况发生在上下文中有太多噪音、后者存在矛盾的信息时。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wendaJ

关注关注

15
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Seven Failure Points When Engineering a Retrieval Augmented Generation System

c_cpp_csharp的专栏

11-14

326

软件工程师越来越多地使用一种称为检索增强生成（RAG）的策略向应用程序添加语义搜索功能。RAG 系统涉及查找在语义上与查询匹配的文档，然后将文档传递给大型语言模型（LLM），例如 ChatGPT，以使用 LLM 提取正确答案。RAG 系统旨在：a）减少 LLM 的幻觉反应问题，b）将来源/参考文献链接到生成的响应，以及 c）消除使用元数据注释文档的需要。然而，RAG 系统存在信息检索系统固有的限制和对 LLM 的依赖。

百篇论文博文导航AI工程之路：FT、KG、RAG与Agent技术全方位探索

热门推荐

丨汀、的博客

07-08

1万+

百篇论文博文导航AI工程之路：FT、KG、RAG与Agent技术全方位探索

参与评论您还未登录，请先登录后发表或查看评论

【论文阅读】Seven Failure Points When Engineering a Retrieval Augmented Generation System

qq_41502855的博客

07-13

1205

论文从软件工程的角度，通过对3个case study的研究，总结出rag的7个故障点。

【论文解读】《Seven Failure Points When Engineering a Retrieval Augmented Generation System》

qq_30731313的博客

03-03

673

面向科研文献分析的系统，帮助研究者对上传的相关论文进行排序和问答。AI Tutor教育领域的 RAG 系统，集成到学习管理系统中，支持学生对学习内容提问，并提供可追溯答案来源。使用 BioASQ 数据集构建的生物医学问答系统，针对领域特定的问题进行回答，考验系统在大规模文献中提取信息的能力。论文为软件工程师在构建 RAG 系统时提供了一个宝贵的经验总结，通过三个不同领域的案例研究，揭示了从文档分块、嵌入生成、检索、整合到回答生成过程中可能遇到的七大失败点。

《设计 RAG 系统时需要考虑的七个失败点》论文 AI 解读

悟鸣的技术博客

08-03

1644

周末使用 AI 速度了一篇 RAG 相关的论文，文中提到的【设计 RAG 系统时需要考虑的七个失败点】非常有价值，简单整理一下分享出来，大家如果感兴趣可以继续阅读原文。论文名称：Seven Failure Points When Engineering a Retrieval Augmented Generation System论文中文名：工程检索增强生成系统时的七个失败点。

RAG常见七大坑

weixin_43564920的博客

01-27

1924

软件工程师越来越多地使用一种被称为检索增强生成（Retrieval Augmented Generation，RAG）的策略向应用程序添加语义搜索功能。RAG系统涉及查找在语义上与查询匹配的文档，然后将这些文档传递给大型语言模型（LLM），例如ChatGPT，以提取正确的答案。RAG系统的目标是：a）减少LLM产生虚构响应的问题，b）将来源/参考链接到生成的响应，c）消除对文档进行元数据标注的需求。然而，RAG系统存在信息检索系统固有的局限性，并依赖于LLM。

深度挖掘全通宝典：提示工程架构师提示工程文档规范指南深度挖掘全通宝典

AI云原生与云计算技术学院

08-23

818

提示工程不是“写句子”，而是“软件工程”：文档规范是将其工程化的核心手段。架构师的价值在于“体系设计”：通过分层架构、模块化复用、工具链集成，将个人经验转化为组织能力。从“文档规范”到“工程体系”：文档是起点，最终目标是构建“提示词可复用、变更可追溯、质量可保障”的全流程体系。张XX，资深提示工程架构师，10年AI研发经验，曾主导电商、金融等领域大型提示工程体系建设，专注于AI工程化落地。公众号：“AI架构师笔记”，定期分享提示工程、LLMOps实践。字数统计：约10500字版权声明。

大数据OLAP性能优化：10个必知技巧

AI架构师小马

08-20

852

在数据驱动决策的时代，OLAP（在线分析处理）系统已成为企业洞察数据价值的核心工具。然而，随着数据量呈爆炸式增长、查询复杂度不断提升，OLAP性能问题逐渐成为制约业务分析效率的瓶颈。本文深入剖析了大数据OLAP系统的性能挑战，系统总结了10个经过实践验证的性能优化技巧。从基础的存储结构优化到高级的查询智能重写，从硬件资源配置到软件算法调优，我们将带领读者一步步揭开OLAP性能优化的神秘面纱。

人脸识别的发展和基础概念

hfut_why的博客

05-15

8375

人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部识别的一系列相关技术，通常也叫做人像识别、面部识别。2017年9月13号，IPhoneX发布的时候，基于3D结构光的人脸解锁是亮点之一，下面是其前置的传感器结构：之后的荣耀V10也是搭载了2D的人脸识别,当然，效...

RAG——应用——七个最常见的故障点

fan_fan_feng的专栏

01-29

1355

近日，国外研究者发布了一篇论文《Seven Failure Points When Engineering a Retrieval Augmented Generation System》，探讨了在实际工程落地RAG应用过程中容易出的七类问题。论文地址：https://arxiv.org/pdf/2401.05856.pdf。

论文笔记：Seven Failure Points When Engineering a Retrieval AugmentedGeneration System

qq_40206371的博客

03-24

650

CAIN 2024。

12个RAG常见痛点及解决方案

deephub

02-03

5512

我们探讨了在开发RAG管道过程中的12个痛点(其中7个来自论文，另外5个来自我们的总结)，并针对这些痛点提出了相应的解决方案。下面是本文的引用参考作者:Wenqi Glantz。

RAG系统“一周出demo，三月用不好“

AI人工智能的学习之路

03-16

1163

随着大语言模型（LLM）的广泛应用，检索增强生成（RAG）技术作为一种结合检索技术和LLM提示的创新架构，因其在结合外部知识库和生成模型方面的卓越表现而备受关注。RAG系统通过将LLM与结构化或非结构化的外部数据源相结合，显著提升了生成内容的准确性、相关性和可信度。RAG在聊天机器人、知识密集型任务和企业应用中表现出色。然而，从理论到工程实践，开发和优化一个高效的RAG系统并非易事，RAG系统面临着诸多挑战。本文将系统性分析RAG系统的开发难点与优化路径。

基准测试使用BBO-PSO-GA附Matlab代码.rar

最新发布

12-09

1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

【无人机路径规划】基于冠豪猪优化算法的三维路径规划模型设计：多目标约束下安全高效飞行路径生成方法项目介绍 Python实现基于冠豪猪优化算法（CPO）进行无人机三维路径规划（含模型描述及部分示例代码

12-09

内容概要：本文介绍了一个基于冠豪猪优化算法（CPO）的无人机三维路径规划项目，利用Python实现了在复杂三维环境中为无人机规划安全、高效、低能耗飞行路径的完整解决方案。项目涵盖空间环境建模、无人机动力学约束、路径编码、多目标代价函数设计以及CPO算法的核心实现。通过体素网格建模、动态障碍物处理、路径平滑技术和多约束融合机制，系统能够在高维、密集障碍环境下快速搜索出满足飞行可行性、安全性与能效最优的路径，并支持在线重规划以适应动态环境变化。文中还提供了关键模块的代码示例，包括环境建模、路径评估和CPO优化流程。; 适合人群：具备一定Python编程基础和优化算法基础知识，从事无人机、智能机器人、路径规划或智能优化算法研究的相关科研人员与工程技术人员，尤其适合研究生及有一定工作经验的研发工程师。; 使用场景及目标：①应用于复杂三维环境下的无人机自主导航与避障；②研究智能优化算法（如CPO）在路径规划中的实际部署与性能优化；③实现多目标（路径最短、能耗最低、安全性最高）耦合条件下的工程化路径求解；④构建可扩展的智能无人系统决策框架。; 阅读建议：建议结合文中模型架构与代码示例进行实践运行，重点关注目标函数设计、CPO算法改进策略与约束处理机制，宜在仿真环境中测试不同场景以深入理解算法行为与系统鲁棒性。

使用python语言的京东平台抢购脚本

12-09

先看效果： https://pan.quark.cn/s/4f231e33b729 auto-buy-Python-tool 图形界面, 电脑小白也会用, 下载可直接运行! 京东自动购买口罩实时抢购口罩工具, 抗击疫情中国加油! :fire: 点击这里下载, 解压后可直接运行! 欢迎加星修复了商品下架后的问题, 更新了交互界面; 修复了可配货商品的判断, 更新了数量调整接口, 更新了是否监控下架商品选项 :star2: 使用指南 :notebookwithdecorative_cover: Tips: 登录一次之后本地会保存登录信息, 重启软件(注意重启之后也行)之后仍然可以记住账号登录信息, 重启之后只需点击"开始监控"就可以登录! 不必重复扫码! 运行界面如下图: interface Update at 2020-3-2: Continuously monitor goods removed from JD.monitorSoldOutGoods Update at 2020-2-15: quantity can be modifiedquantity 填写方式: Tips: 软件启动时带有标准填写格式的默认值, 请留意. 输入商品ID: 比如为: https://item.jd.com/1835967.html 的商品ID为1835967. 输入收件地区编码: 使用Chrome浏览器(如果是其他浏览器请用同样方式打开开发者工具)登录京东并访问商品页, 选择派送地址后按查找开头的讯息, 如下图: AreaID 接受讯息邮箱: 您的接受讯息邮箱. 滑动条: 控制监控时查询的速度(频率). 购买数量: 调整一次购买数量. 是否自动忽略下架商品: 未打...

clustering-results-PathologyGAN.csv

12-09

clustering-results-PathologyGAN.csv