
How to Build Agentic GraphRAG?By Sara Tilly
上周,Memgraph 举办了一次社区电话会议,讨论 AI 中一个令人兴奋的话题 — Agentic GraphRAG。如果您错过了,以下是我们的开发人员体验工程师 Ante Javor 对网络研讨会亮点的深入探讨。讨论涵盖了从 GraphRAG 的基础知识到 Memgraph 3.0 版的新功能,以及为什么代理对于推进 GraphRAG 至关重要的所有内容。让我们来分析一下。
Agentic GraphRAG 致力于克服大型语言模型(LLM)的局限性,结合知识图谱提供更丰富、更精确的见解,尤其适用于医疗保健、金融等数据复杂性和关系重要的场景
https://memgraph.com/blog/build-agentic-graphrag-ai
https://github.com/memgraph/ai-demos/tree/main/agentic-graph-rag/agentic


























GraphRAG 很棒,但如果它有大脑呢?
要了解 Agentic GraphRAG,您首先需要了解 RAG(检索增强生成)及其基于图的表亲 GraphRAG 的基础知识。
RAG 在克服大型语言模型 (LLM) 的局限性方面扭转了局面。微调 LLM 成本高昂、速度缓慢,而且通常不切实际,除非您拥有大量 GPU 和财力雄厚的预算。您的另一个解决方案是 RAG。RAG 不是微调,而是将相关的实时上下文动态馈送到 LLM 中,以生成个性化答案。它更快、可扩展性更强、灵活性更高。
但是 RAG 有局限性。这取决于所提供的上下文的质量。如果你在提示中塞入太多不相关的数据或未能管理信息,你的 LLM 将返回低于标准的结果。你还必须管理有限的上下文窗口和 LLM 充当“文本预测器”而不是真正的推理系统的固有约束。
然后你有 GraphRAG,顾名思义,通过使用知识图谱作为基础,将其提升了一个档次。GraphRAG 最初由 Microsoft 开发,将数据构建为节点和关系,提供更丰富、更精确的见解。它非常适合数据复杂性和关系很重要的情况,例如医疗保健、金融等。
为什么做GraphRAG Agentic?
虽然 GraphRAG 很棒,但它有一个缺陷:僵化。传统的 GraphRAG 系统对用于数据检索的管道进行硬编码。这对于简单的用例非常有用,但对于复杂、不断发展的场景来说是有限的。这是你使用代理方面的地方。
正如 Ante 所解释的那样,代理只是使用 LLM 与外部数据源交互的决策系统。将它们视为与数据动态交互并为每个查询决定最佳检索策略的编排器。
从本质上讲,代理只是具有特定上下文的 LLM 调用。它通过知道(或不知道)的内容来获取您的输入和推理,并与外部工具或数据库(如 Memgraph)交互以检索最相关的答案。在这种情况下,代理不仅检索数据,还会弄清楚如何以最有效的方式检索数据。
例如,代理可能会使用 BFS 或 PageRank 等图形遍历算法来查找知识图谱中最相关的节点,而不是总是依赖向量搜索。这种动态决策过程在 AI 驱动型系统中解锁了新的灵活性、可扩展性和智能水平。
以下是 Agentic GraphRAG 改进知识检索的方式:
- 灵活性 : 代理不局限于一种方法,他们为任务选择最佳工具或算法。
- 自治 :设置完成后,系统独立运行,需要最少的人工干预。只是你密切关注它。
- 错误处理 :反馈循环允许代理动态重试、诊断问题并从故障中恢复。
Agentic GraphRAG 被视为一个状态机,代理将决策和作链接在一起,在每一步共享上下文和结果。这种架构实现了更智能、响应速度更快的系统。
Memgraph 3.0 和 Agentic GraphRAG
最近发布的 Memgraph 3.0 对我们来说意义重大,这是有充分理由的。借助矢量搜索、动态算法和高可用性等功能,构建生产就绪型 AI 应用程序比以往任何时候都更容易。
是什么让这些功能对 GraphRAG 系统如此关键?
-
向量搜索 :您现在可以使用嵌入来搜索数据。例如,在图形中搜索相似节点(例如查找名为 Mark 的患者并遍历一两个跃点以发现相关症状)与 Memgraph 的向量功能是无缝的。
-
动态算法 :不再需要严格的管道。Memgraph 允许您使用 BFS、DFS、PageRank 或社区检测等算法来根据您的用例提取相关数据。
-
高可用性 :构建生产系统需要可靠性。Memgraph 3.0 可确保基于 GraphRAG 的应用程序可以顺利扩展。
Agentic GraphRAG 的工作原理:核心工作流程
构建 Agentic GraphRAG 系统涉及创建一个代理管道,每个代理负责流程中的特定步骤。这是一个典型的工作流程,您也将在演示中看到。
-
问题分类
第一个代理分析用户查询并确定其类型。 例如:
-
- 检索问题涉及直接查找,例如“John 的年龄是多少?
- 结构化问题探讨关系,例如“可口可乐与股市趋势有关吗?
- 全局查询分析趋势,例如“前 10 个最重要的节点是什么?
- 数据库问题涉及系统配置,例如“Memgraph 使用什么日志记录级别?
-
Tool selection工具选择
根据查询类型,另一个代理选择最佳工具来检索所需数据。这可能包括向量搜索、PageRank、BFS(广度优先搜索)、DFS(深度优先搜索)或数据库架构查询。
-
所选工具处理查询,检索相关数据或结果。代理可以调整工具以满足查询的特定需求。例如,PageRank 查询可能会返回广泛查询的前 10 个节点或特定问题的单个节点。
-
如果工具失败(例如,由于查询配置错误或缺少数据),代理会诊断问题、重试或切换到替代工具。这些反馈循环可确保可靠的错误处理。
-
处理后的数据将作为有意义的答案返回给用户。
使用 Memgraph 构建代理 GraphRAG
由于其先进的图形数据库功能,Memgraph 非常适合为 Agentic GraphRAG 提供支持。使用 Memgraph,您可以创建一个灵活的系统,以适应各种查询和检索任务。Ante 在 Memgraph 社区电话会议中展示的演示展示了如何使用 Memgraph 构建 Agentic GraphRAG。它不仅仅是一个概念验证,还是一个可以复制和扩展的工作模型。
以下是您需要了解的有关演示的信息:
- 它与数据集无关。
- 该演示不依赖于 LangChain 等外部工具;相反,它专注于原始 OpenAI API 调用,以加快迭代速度。
- 从问题分类到工具选择,每个步骤都是自动化的。根据问题类型,代理选择 PageRank、BFS 或架构查询等工具。
- 我们已经实施了错误恢复,因此反馈循环可以确保故障的处理。
- 演示中使用的所有功能都在 Memgraph 中,包括用于基于相似性的查询的向量搜索、用于自然语言查询的文本到密码翻译、用于数据库结构探索的架构信息、图形遍历算法(BFS、DFS)和 PageRank。
**Agentic GraphRAG 的未来
在网络研讨会的最后,我们提出了对 Agentic GraphRAG 愿景的一些想法和观点。
目前,该演示在根据所提出的问题类型选择合适的工具方面做得很扎实。但还有很多空间可以使其更加智能。我首先想到的事情之一是扩展工具集。虽然它已经支持矢量搜索、PageRank、BFS/DFS 和文本转密码,但我们可以投入更多内容。地理搜索将是一个很好的补充,它允许空间查询,并且集成更高级的基于文本的查询可以帮助使系统更灵活地处理非结构化数据。
另一个重大飞跃是全自动工具选择。目前,工具选择过程在某种程度上受到问题类型和工具之间预定义映射的限制。但是,如果我们不必预定义任何内容呢?如果代理本身可以弄清楚要使用哪个工具呢?
然后是一个伟大的想法:一个通用的知识检索代理。想象一下,一个代理能够从任何图形中提取知识,在检索方法、图形算法甚至外部数据源之间无缝切换,而无需人工干预。像这样的系统不仅会回答问题,还会通过问题进行推理,动态导航图形,选择最佳工具,并以给定上下文有意义的方式构建响应。与其考虑“我应该使用哪种工具”,不如有一个只知道该做什么的代理。
目标不仅仅是构建有效的东西,而是不断迭代、改进和突破 Agentic GraphRAG 的可能性界限。有了 Memgraph 3.0,您就拥有了构建自己的 Agentic GraphRAG 的完美平台。无论您是在医疗保健、金融还是任何数据驱动领域工作,该系统的灵活性和强大功能都将解锁新的可能性。
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
优快云粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传优快云,朋友们如果需要可以扫描下方二维码&点击下方优快云官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉优快云大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)

👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。


👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

👉4.大模型落地应用案例PPT👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)

👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)


👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习
优快云粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传优快云,朋友们如果需要可以扫描下方二维码&点击下方优快云官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉优快云大礼包:《最新AI大模型学习资源包》免费分享 👈👈
898

被折叠的 条评论
为什么被折叠?



