最近Graph RAG非常火,它来自微软的一篇论文《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》,论文地址:https://arxiv.org/pdf/2404.16130。本文将对RAG 和 Graph RAG在架构和成本方面做简要分析。
一、RAG 和 Graph RAG 的架构
RAG 方法体系结构可以分为两个不同的阶段:索引阶段和查询阶段。
在索引阶段,将完成非结构化文本的预处理和矢量存储中的存储。
在查询阶段,将用户查询通过嵌入模型转换为嵌入,并从向量数据库中检索类似的内容,LLM根据问题和检索内容生成答案。
1.1 RAG架构
检索增强生成(RAG)是一个框架,通过支持外部知识源的模型来补充LLM信息的内部表示,从而提高LLM生成响应的质量。
在基于LLM问答的系统中实施 RAG 的主要好处是它确保模型可以访问最新、最可靠的事实,并且用户可以访问模型的来源,确保其声明可以被检查为准确性并最终被信任。
1.2 Graph RAG
在检索增强生成 (RAG) 的上下文中,Graph RAG 引入了一项重大增强功能:<