大模型
文章平均质量分 87
爱分享的小明
分享各种实用的文档、工具感谢大家的关注
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
理解 RAG 第八部分:缓解 RAG 中的幻觉
幻觉是当今基于语言模型的人工智能系统面临的一个关键问题,RAG 系统尽管能够部分解决这一问题,却也不例外。本文探讨了 RAG 背景下的幻觉问题,重点阐述了在生成响应之前检索外部信息的系统中仍可能出现幻觉的原因,并提出了可在 RAG 系统、数据库和知识库中实施的几种实用策略,以缓解幻觉问题。原创 2025-04-29 08:34:09 · 860 阅读 · 0 评论 -
理解 RAG 第七部分:矢量数据库和索引策略
简而言之,向量数据库是一种专门针对以高维向量表示的文本的存储和检索进行优化的数据库。为什么这些数据库对 RAG 至关重要?因为向量表示能够对大型文档库进行高效的相似性搜索,从而根据用户查询快速检索相关信息。在向量数据库中,语义相似的文档具有更接近的向量表示。例如,与两篇地中海餐厅评论相关的向量彼此之间的相似度,远高于与一篇西班牙餐厅评论和一篇关于古典音乐的新闻文章相关的向量。同样,包含与用户查询语义相关的文本的文档,可以通过点积和余弦相似度等向量运算高效地检索出来。原创 2025-04-29 08:33:15 · 584 阅读 · 0 评论 -
理解 RAG 第六部分:有效的检索优化
本文探讨了六种旨在提升 RAG 系统检索过程性能的策略。每种技术的复杂程度各不相同,并侧重于不同的优化方面。了解这些策略对于选择适合您特定 RAG 实现的最佳方法(无论是单一技术还是多种技术的组合)至关重要。原创 2025-04-28 15:48:48 · 852 阅读 · 0 评论 -
理解 RAG 第五部分:管理上下文长度
上下文摘要是 RAG 系统中一种更复杂的上下文长度管理方法,我们在构建最终上下文的过程中应用文本摘要技术。一种可行的方法是使用一个额外的语言模型(通常规模较小,且经过摘要任务训练),用于对检索到的大量文档进行摘要。摘要任务可以是提取式的,也可以是抽象式的。提取式识别并提取相关的文本段落,抽象式从头生成摘要,对原始文本块进行重新表述和精简。此外,一些 RAG 解决方案使用启发式方法来评估文本片段(例如文本块)的相关性,并丢弃相关性较低的文本块。战略概括文档分块。原创 2025-04-28 15:47:57 · 923 阅读 · 0 评论 -
理解 RAG 第四部分:RAGA 和其他评估框架
(LLM)的局限性和克服其诸多限制方面发挥了关键作用。通过整合检索器,RAG 增强了响应的相关性和事实准确性:它只需实时利用外部知识源(例如矢量文档库),并在原始用户查询或提示中添加相关的上下文信息,然后将其传递给 LLM 进行输出生成。对于那些深入 RAG 领域的人来说,一个自然而然的问题出现了:我们如何评估这些远非简单的系统?为此,存在几个框架,例如,它提供了超过 14 种评估指标来评估幻觉和忠实度等标准;,以其模块化和简单性而闻名,可以在自定义管道中进行评估;原创 2025-04-28 15:47:11 · 714 阅读 · 0 评论 -
理解 RAG III:融合检索与重新排序
之前介绍了什么是RAG,为什么它在大型语言模型(LLM)的背景下很重要,以及RAG的经典检索器生成器系统是什么样子的,“理解RAG”系列的第三篇文章探讨了构建RAG系统的升级方法:融合检索。在深潜之前,值得简要回顾一下我们在本系列第二部分中探索的基本RAG方案。RAG基本方案。原创 2025-04-28 15:45:35 · 895 阅读 · 0 评论 -
理解 RAG 第二部分:经典 RAG 的工作原理
在本系列的第一篇文章中,我们介绍了**检索增强生成 (RAG) ,并解释了扩展传统****大型语言模型 (LLM)**功能的必要性。我们还简要概述了 RAG 的核心思想:从外部知识库中检索上下文相关的信息,以确保 LLM 生成准确且最新的信息,而不会产生幻觉,也无需不断地重新训练模型。本系列的第二篇文章将揭秘传统 RAG 系统运行的机制。尽管如今随着人工智能的迅猛发展,各种增强版和更复杂的 RAG 版本几乎每天都在涌现,但要理解最新的 RAG 方法,第一步是理解经典的 RAG 工作流程。原创 2025-04-28 15:41:26 · 768 阅读 · 0 评论 -
理解 RAG 第一部分:为什么需要它
(AI)的一个领域,旨在教会计算机理解人类的书面和口头语言,并运用这些语言与人类互动。虽然传统的 NLP 方法已研究数十年,但近年来出现的(LLM) 几乎主导了该领域的所有发展。LLM 通过将复杂的深度学习架构与能够分析语言中复杂模式和相互依赖关系的自注意力机制相结合,彻底改变了 NLP 和整个人工智能领域。LLM 能够处理广泛的语言生成和语言理解任务,并具有广泛的应用范围,例如对话聊天机器人、深度文档分析、翻译等等。LLM 最常执行的一些任务。原创 2025-04-28 15:40:07 · 622 阅读 · 0 评论
分享