检索增强生成 (Retrieval-Augmented Generation, RAG) 已经成为构建知识密集型 NLP 应用的流行范式。RAG 通过结合大型语言模型 (LLM) 的生成能力和外部知识库的检索能力,能够生成更准确、更可靠、更具信息量的响应。然而,传统的 RAG 方法通常将知识库视为扁平的文档集合,忽略了知识之间的结构化关系。GraphRAG 将知识图谱 (Knowledge Graph, KG) 引入 RAG,利用知识图谱中丰富的实体关系信息,增强了 RAG 的检索和推理能力。
1. 什么是 GraphRAG?
GraphRAG 是一种将知识图谱与 RAG 相结合的技术。它利用知识图谱中的实体和关系来增强检索过程,并为 LLM 提供更丰富的上下文信息,从而提高生成答案的质量。
与传统 RAG 的对比:
- 传统 RAG:
- 知识库:扁平的文档集合(例如文本文件、网页)。
- 检索:基于关键词或语义相似度进行文档检索。
- 缺点:忽略了知识之间的结构化关系,难以处理需要推理的复杂查询。
- GraphRAG: