
Medium精选
文章平均质量分 97
Medium好文精选翻译专栏 —— 这里,我们为您挑选并翻译Medium上的优质文章。每一篇都是智慧的火花,每一次阅读都是心灵的旅行。让我们一起慢下来,品味文字的力量,感受思想的深度。
静愚 AGI
一句话记住我:静水流深,大智若愚。
专注AIGC开发技术分享,致力于成为AIGC领域的优秀博主。
展开
-
《Advanced RAG》-09-Prompt 压缩(二)
文章主要介绍了提升大型语言模型效率的提示压缩技术,包括方法分类、算法原理和代码实现,并详细介绍了四种主要的提示压缩方法:基于信息熵的方法、基于软提示调整的方法、基于数据提炼的方法和基于标记合并或剪枝的方法。原创 2024-08-13 08:00:00 · 1216 阅读 · 0 评论 -
《Advanced RAG》-09-Prompt 压缩(一)
文章主要介绍了提升大型语言模型效率的提示压缩技术,包括方法分类、算法原理和代码实现,并详细介绍了四种主要的提示压缩方法:基于信息熵的方法、基于软提示调整的方法、基于数据提炼的方法和基于标记合并或剪枝的方法。原创 2024-08-12 07:48:46 · 1226 阅读 · 0 评论 -
《Advanced RAG》-12-增进RAG的全局理解(二)
本文介绍了四种改进RAG(Retrieval-Augmented Generation)模型的方法,以增强对文档或语料库的全面理解,并详细阐述了每种方法的理论基础、实现过程和实验结果。原创 2024-08-15 08:00:00 · 986 阅读 · 0 评论 -
《Advanced RAG》-12-增进RAG的全局理解(一)
本文介绍了四种改进RAG(Retrieval-Augmented Generation)模型的方法,以增强对文档或语料库的全面理解,并详细阐述了每种方法的理论基础、实现过程和实验结果。原创 2024-08-14 08:00:00 · 1332 阅读 · 0 评论 -
《Advanced RAG》-11-RAG查询分类和细化
文章介绍了两种高级的检索增强生成(RAG)技术:自适应 RAG 和 RQ-RAG,以及它们在问题复杂性学习和查询细化方面的应用和优势,以及如何通过小型模型的训练来提高这些技术的性能。原创 2024-08-11 21:49:34 · 1847 阅读 · 0 评论 -
《Advanced RAG》-10-Corrective Retrieval Augmented Generation (CRAG)
CRAG 设计了一个轻量级检索评估器,用于评估针对特定查询检索到的文档的整体质量,并使用网络搜索作为改进检索结果的辅助工具。CRAG 可与基于 RAG 的各种方法无缝集成,并提供了一个插件式的解决方案。CRAG 的主要思想是引入一个检索评估器,用于评估检索文档与查询之间的关系,并根据评估结果分为三种情况:正确、不正确和模棱两可。原创 2024-08-09 08:00:00 · 1276 阅读 · 0 评论 -
《Advanced RAG》-08-探索RAG之Self-RAG
本文介绍了自我增强生成(Self-RAG)技术,它是传统的检索增强生成(RAG)的改进,能够更精确地控制文本生成过程。原创 2024-08-08 08:00:00 · 3027 阅读 · 0 评论 -
《Advanced RAG》-07-探索 RAG 中表格数据的处理方案
文章详细讨论了实现 Retrieval-Augmented Generation(RAG)时对表格进行处理的挑战,特别是在非结构化文档中自动准确地提取和理解表格信息。首先介绍了RAG中管理表格的关键技术,包括表格解析和索引结构设计。接着,文章回顾了一些现有的开源解决方案,如LlamaIndex和Langchain提出的方法。然后,文章提出了一种新的解决方案,使用Nougat模型进行表格解析,能够准确地提取表格和表格标题,并通过多向量检索器构建文档摘要索引结构,以便更有效地存储和检索表格的语义信息。原创 2024-08-05 22:19:59 · 2261 阅读 · 0 评论 -
《Advanced RAG》-06-探索RAG技术 Query Rewriting
详细阐述了多种查询重写技术,这些技术用于在检索增强生成(RAG)中优化查询和文档之间的语义匹配。原创 2024-08-07 08:00:00 · 1487 阅读 · 0 评论 -
《Advanced RAG》-04-深度研究RAG技术Re-ranking
如图 1 所示,重新排序的任务就像一个智能过滤器。当检索器从索引集合中检索出多个上下文时,这些上下文可能与用户的查询具有不同的相关性。有些上下文可能非常相关(图 1 中红色方框中突出显示的内容),而其他上下文可能只是略有相关甚至不相关(图 1 中绿色和蓝色方框中突出显示的内容)。重新排序的任务是评估这些上下文的相关性,并优先选择最有可能提供准确和相关答案的上下文。这样,LLM 就能在生成答案时优先考虑这些排名靠前的上下文,从而提高答案的准确性和质量。原创 2024-08-06 08:00:00 · 3466 阅读 · 0 评论 -
《Advanced RAG》-05-探索语义分块(Semantic Chunking)
文章首先介绍了语义分块在 RAG 中的位置和作用,并介绍了常见的基于规则的分块方法。然后,阐述了语义分块的目的是确保每个分块包含尽可能多的独立语义信息。接着,文章分别介绍了三种语义分块方法的原理和实现方法,并对每种方法进行了总结和评估。原创 2024-08-05 08:00:00 · 1926 阅读 · 0 评论 -
《Advanced RAG》-03-使用 RAGAs + LlamaIndex 进行 RAG 评估
文章首先介绍了 RAG 评估的三个主要部分:输入查询、检索上下文和 LLM 生成的响应。提到了 RAGAs 提出的 RAG 评估指标,包括 Faithfulness、Answer Relevance 和 Context Relevance,以及 RAGAs 网站提供的两个额外指标:Context Precision 和 Context Recall。详细解释了每个指标的计算方法,并提供了一些示例。最后,它介绍了使用 RAGAs 和 LlamaIndex 进行 RAG 评估的主要过程。原创 2024-08-04 17:31:26 · 1148 阅读 · 0 评论 -
《Advanced RAG》-02-揭开 PDF 解析的神秘面纱
PDF 文件是非结构化文档的代表,但从 PDF 文档中提取信息是一个具有挑战性的过程。PDF 文件由一系列指令组成,这些指令指示 PDF 阅读器或打印机在屏幕或纸张上显示符号的位置和方式。与 HTML 和 docx 等文件格式不同,后者使用标记来组织不同的逻辑结构。解析 PDF 文档的挑战在于准确提取整个页面的布局,并将内容(包括表格、标题、段落和图像)转化为文档的文本表示。这一过程涉及处理文本提取中的不准确性、图像识别以及表格中行列关系的混淆。原创 2024-08-04 17:22:40 · 1306 阅读 · 0 评论 -
《Advanced RAG》-01-朴素RAG存在的问题
文章阐述了RAG技术如何通过整合外部知识源来提升大型语言模型(LLM)的性能,使其能够产生更精确、上下文感知的回应,并减少幻觉现象。自2023年以来,RAG已成为基于LLM的系统中最流行的架构,许多产品依赖此技术。然而,RAG在信息检索、上下文整合等方面存在问题。原创 2024-08-03 22:34:37 · 1497 阅读 · 0 评论