这是一个非常重要且强大的 RAG 进阶技术,它通过引入知识图谱来解决传统向量检索RAG的局限性。
什么是 GraphRAG?
GraphRAG 是一种将知识图谱与检索增强生成相结合的高级 RAG 架构。它的核心思想不是将文档简单地切分成孤立的文本块,而是从整个文档集中提取出实体、概念以及它们之间的复杂关系,构建一个结构化的、全局的知识图谱。在回答问题时,系统从这个图谱中检索相关的子图作为上下文,提供给 LLM 生成答案。
简单来说:
- 传统 RAG:检索与问题最相似的几段文本。
- GraphRAG:检索与问题最相关的一组相互关联的事实和概念。
为什么需要 GraphRAG?传统 RAG 的局限性
传统 RAG 在某些场景下表现不佳:
- “大海捞针”问题:当答案所需的信息分散在多个文档或一个长文档的不同部分时,简单的向量相似度检索可能无法一次性找回所有关键片段。
- 多跳推理问题:对于需要连接多个事实才能回答的复杂问题,传统 RAG 缺乏对实体关系的显式建模。
- 示例问题:“去年获得‘最佳创新奖’的公司的 CEO 最近发表了什么言论?”
- 传统 RAG:可能分别检索到“A公司获奖”和“某CEO言论”的片段,但很难自动建立连接。
- GraphRAG:知识图谱中明确存储了
(A公司)-[获得]->(最佳创新奖)和(某人)-[是...CEO]->(A公司)以及

最低0.47元/天 解锁文章
1753

被折叠的 条评论
为什么被折叠?



