graphrag+ollama+neo4j本地化部署可视化使用

xiaomu_347

已于 2024-08-11 08:54:43 修改

阅读量4.5k

点赞数

分类专栏： LLM——AIGC 文章标签： graphrag llm

于 2024-07-12 18:39:15 首次发布

本文链接：https://blog.youkuaiyun.com/xiaomu_347/article/details/140386297

版权

LLM——AIGC 专栏收录该内容

21 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

最近微软团队开源了一款数据工作流与转换工具 GraphRAG，利用LLM，帮助用户从非结构化文本数据中提取结构化数据，并完成数据索引。与传统的在文本片段中，基于语义查询的RAG不同，GraphRAG从原始文本中，提取数据，构建知识图谱，并利用这些结构化数据完成RAG任务。相较于传统RAG，GraphRAG在回答全局性问题时，表现非常出色。

GraphRAG | Get Started:

https://microsoft.github.io/graphrag/posts/get_started/

GraphRAG | GitHub:

https://github.com/microsoft/graphrag

（1）基本使用

根据官方介绍，python环境最好在3.10-3.12，下面直接pip安装

conda create -n grag python=3.10
pip install graphrag

然后依次创建一个示例工程

mkdir -p ./ragtest/input ###项目工程
curl https://www.gutenberg.org/cache/epub/24022/pg24022.txt >

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xiaomu_347

关注关注

0
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

玩转大语言模型——使用GraphRAG+Ollama本地构建知识图谱（完全本地化，不依赖OpenAI）

艾醒的博客

01-16

2200

下载过程分为两种，一种是下载项目，另外一种是直接使用pip下载，两种用法最后的效果是一致的，如果不需要修改源码，可以选择pip方式下载，这样比较方便。不过当前的模型并不能直接拿来使用，我们需要修改一下，不如可能会出现一些奇怪的错误，笔者遇到的问题是在生成entities时识别不到entity。，如果是用项目方式下载，直接在项目下新建，如果是使用pip方式下载的，新建一个项目在新建的项目里新建文件夹。构建索引的过程就是构建知识图谱的过程，同样的，读者需要将笔者的路径替换为自己的路径。，修改以下两部分，将。

将 Microsoft GraphRAG 集成到 Neo4j 将 MSFT GraphRAG 输出存储到 Neo4j 中，并使用 LangChain 或 LlamaIndex 实现本地和全局检索器

iCloudEnd的博客

08-01

630

微软的 GraphRAG 实现最近引起了广泛关注。在我上一篇博客文章中，我讨论了如何构建图表，并探讨了研究论文中强调的一些创新方面。从高层次来看，GraphRAG 库的输入是包含各种信息的源文档。使用大型语言模型 (LLM) 处理文档，以提取有关文档中出现的实体及其关系的结构化信息。然后使用提取的结构化信息来构建知识图谱。知识图谱构建完成后，GraphRAG 库结合图算法，特别是莱顿社区检测算法和 LLM 提示，生成知识图谱中发现的实体和关系社区的自然语言摘要。

参与评论您还未登录，请先登录后发表或查看评论

GraphRAG+Ollama实现本地部署+neo4j可视化结果

qq_42703164的博客

10-14

4801

最近部署微软的graphrag踩了很多坑，记录一下完整的流程，给后来者一些参考。目前使用graphrag还是有一点问题，如果后续解决了会在文章中进行补充。

【AI大模型部署】GraphRAG + Ollama 本地部署全攻略：避坑实战指南

嘴巴吃糖了

04-16

1258

微软开源 GraphRAG 后，热度越来越高，目前 GraphRAG 只支持 OpenAI 的闭源大模型，导致部署后使用范围大大受限，本文通过 GraphRAG 源码的修改，来支持更广泛的 Embedding 模型和开源大模型，从而使得 GraphRAG 的更容易上手使用。

GraphRAG+Ollama，构建本地精准全局问答系统！

m0_59235699的博客

07-30

1716

部署GraphRAG配置Neo4j实现知识图谱可视化【踩坑经历】

最新发布

qq_52148082的博客

05-14

1284

本文介绍了如何在本地部署GraphRAG，并将其生成的知识图谱导入Neo4j图数据库。

使用GraphRAG+LangChain+Ollama：LLaMa 3.1跑通知识图谱与向量数据库集成（Neo4j）

mama19971023的博客

08-08

2494

我将向你展示如何使用（一个本地运行的模型）来执行操作，总共就50号代码。。。首先，什么是GraphRAG？GraphRAG是一种通过，关键概念是。▲ 知识图谱与向量数据库集成知识图谱与向量数据库集成是GraphRAG 架构之一：这种方法利用知识图谱和向量数据库来收集相关信息。知识图谱的构建方式可以捕获向量块之间的关系，包括文档层次结构。知识图谱在从向量搜索中检索到的块附近提供结构化实体信息，从而通过有价值的附加上下文丰富提示。这个丰富的提示被输入到 LLM 中进行处理，然后 LLM 生成响应。

GraphRAG本地部署（Xinference本地模型）+ neo4j可视化

2303_78780633的博客

08-09

5839

模型供应商可以选择ollama，Xinference等供应商，也可以用我们本地api封装的大模型。

GraphRAG Visualizer：让复杂的知识图谱一目了然

m0_59235945的博客

01-01

3210

在对数据集建立索引时，GraphRAG主要完成两项核心任务：提取实体(Entity)提取实体之间的关系从视觉角度看，每个实体就是图谱中的一个“点”，而实体之间的关系则通过“线”连接起来，最终构成了一张庞大的知识图谱。这也解释了GraphRAG名称中“Graph”的由来。既然我们知道了GraphRAG的核心在于绘制这张复杂的知识图谱，那么问题来了：有没有一种更直观的方式去感受这张图谱的存在与意义？答案是肯定的。

大模型 | GraphRAG + Ollama 本地部署全攻略：避坑实战指南

老皮的博客

08-24

5437

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

GraphRAG + Ollama 本地部署全攻略：避坑实战指南

musicml的博客

07-24

7987

▼最近直播超级多，预约保你有收获—1—为什么要对 GraphRAG 本地部署？微软开源 GraphRAG 后，热度越来越高，目前 GraphRAG 只支持 OpenAI 的闭源大模型，导致部署后使用范围大大受限，本文通过 GraphRAG 源码的修改，来支持更广泛的 Embedding 模型和开源大模型，从而使得 GraphRAG 的更容易上手使用。如果对 GrapRAG 还不太熟悉的同学，可以看...

AI GraphRAG系列之使用 Neo4j 和 LangChain 实现“从本地到全局”的 GraphRAG：构建图结合文本提取、网络分析和 LLM 提示和总结，以提高 RAG 准确性

iCloudEnd的博客

07-10

1048

我一直对在图表上实现检索增强生成 (RAG) 的新方法很感兴趣，通常称为 GraphRAG。然而，当听到术语 GraphRAG 时，似乎每个人心中都有不同的实现。在这篇博文中，我们将深入探讨“从本地到全局 GraphRAG ”文章和微软研究人员的实现。我们将介绍知识图谱构建和摘要部分，并将检索器留到下一篇博文中。研究人员非常友好地为我们提供了代码存储库，他们还有一个项目页面。

GraphRAG+Ollama实现本地部署（最全，非常详细，保姆教程）

热门推荐

科研探索ing！研究方向：人工智能及优化

07-23

2万+

GraphRAG+Ollama本地部署， GraphRAG Ollama 为了找到一种省钱的方式并且能够使用GraphRAG便可以调用Ollama本地部署的开源大模型，但需要修改部分源码，我已经实现过了，给大家避坑，快读部署。如果对你有用的，欢迎点赞、收藏！

GraphRAG可视化方案

Johntill的博客

09-20

1823

通过 GraphRAG 构建索引数据后，把图数据存储在Parquet文件，在 GraphRAG 执行query时，是使用Python的Pandas库从Parquet文件中读取数据，并将结果存储在一个Pandas DataFrame对象中，然后进行一些数据处理查询。疑问：GraphRAG构建的图谱是什么样子的？质量如何？检索效果不好时，该从哪个角度分析数据进而完善图数据？那么可视化是最直观、最简便的方案了，今天我们一起看一下GraphRAG可视化方案的最佳实践。

GraphRAG本地运行（Ollama的LLM接口＋Xinference的embedding模型）无需gpt的api

m0_56378800的博客

07-10

9044

我们不使用openai就会导致，每次既能get到kwargs.get("is_response_valid")，又得到kwargs.get("is_response_valid")值是false的。这里通过我多次的寻找，发现是graphrag里面的一个包出现了问题，可能没有使用默认调用的openai，在一个is_response_valid总是不能显示。不知道是不是qwen2：0.5b的性能有限，很多global的问题回答成功率会比较低，之后可以自行启动其他的ollama内置的模型。

5分钟手把手系列(二)：本地部署Graphrag（Pycharm+Ollama+LM Studio）

m0_65555479的博客

09-14

2705

通过搭建GraphRAG本地demo后，笔者通过少量的文本内容（三国演义第一章），初略对比了一下传统RAG方案与GraphRAG方案，基于少量文本内容而言，GraphRAG的效果还是符合其宣传内容的，后续更严谨的测试还是需要海量数据的进行验证。希望本文能帮助到对GraphRAG有兴趣的朋友，毕竟读万卷书不如行万里路，看再多的理论介绍，不如自己亲自去动手验证一把来的实在~

graphRAG＋ollama离线环境本地化部署

shlhhy的博客

07-31

1711

启动ollama服务，启动后可以打开网页：http://127.0.0.1:11434。下载安装包，与install.sh放在同一目录。下载install文件。

LLM资料大全：文本多模态大模型、垂直领域微调模型、STF数据集、训练微调部署框架、提示词工程等

2401_85325726的博客

06-15

1815

自ChatGPT为代表的大语言模型（Large Language Model, LLM）出现以后，由于其惊人的类通用人工智能（AGI）的能力，掀起了新一轮[自然语言处理]领域的研究和应用的浪潮。尤其是以ChatGLM、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后，业界涌现了非常多基于LLM的二次微调或应用的案例。本项目旨在收集和梳理中文LLM相关的开源模型、应用、数据集及教程等资料，目前收录的资源已达100+个！底座包含模型模型参数大小训练token数训练最大长度是否可商用。

ollama轻松部署本地GraphRAG（避雷篇）

weixin_63866037的博客

08-18

9584

本篇文章主要介绍如何使用ollama本地部署微软的Graph RAG，，Graph RAG成为RAG一种新范式，对于全局总结性问题表现突出，由ollama一站式解决。但是中间也出现非常多的问题，比如Columns must be same length as key。跟着本篇文章使用ollama+mistral-nemo+mxbai-embed-larg`实现本地的GraphRAG的部署！

graphrag+neo4j

03-14

### GraphRAG 与 Neo4j 集成的技术解析 GraphRAG 是一种基于图结构的数据处理框架，旨在通过自然语言查询来检索和生成信息。而 Neo4j 则是一个流行的图形数据库系统，广泛用于存储和管理复杂的关系数据。两者的集成可以显著提升知识图谱构建、语义搜索以及推荐系统的性能。 #### 图形数据库的基础概念 NoSQL 数据库家族中的图形数据库（如 Neo4j），其核心特点是能够高效地表示和操作具有复杂关系的数据集[^3]。这种能力使得它非常适合用来存储由 GraphRAG 处理后的实体及其关联关系。 #### 技术实现路径要将 GraphRAG 和 Neo4j 进行集成，可以通过以下几种方式： 1. **REST API 调用** 使用 Neo4j 提供的标准 RESTful 接口向数据库发送 Cypher 查询命令。这种方式简单易懂，并且不需要额外安装驱动程序。下面展示了一个基本的 Python 实现例子： ```python import requests NEO4J_URL = 'http://localhost:7474/db/data/cypher' AUTH = ('neo4j', 'password') # 替换为实际用户名密码 def run_cypher_query(query, params=None): payload = {'query': query} if params is not None: payload['params'] = params response = requests.post(NEO4J_URL, json=payload, auth=AUTH) return response.json() result = run_cypher_query('MATCH (n) RETURN n LIMIT 5') print(result) ``` 2. **Bolt 协议连接** 对于更高吞吐量的需求场景下，则建议采用更高效的 Bolt 协议替代传统的 HTTP 请求方法。Python 中有专门针对此目的设计好的包 `py2neo` 或者原生支持该协议的官方客户端库 `neo4j-driver`. 3. **嵌入式部署模式** 如果项目允许的话还可以考虑直接把 Neo4j 嵌入到应用程序内部运行而不是作为独立的服务进程存在。这样做的好处是可以减少网络延迟开销同时也简化了运维管理工作流程。无论选择哪种方案，在具体编码之前都需要先明确业务逻辑需求并据此规划好相应的架构设计方案。 #### 示例代码片段这里给出一段利用 PyTorch 构建神经网络模型并通过 Theano 后端执行训练过程的例子以作参考[^2]: ```python import numpy as np from theano import function, config, shared, tensor import time vlen = 10 * 30 * 768 iters = 1000 rng = np.random.RandomState(22) x = shared(np.asarray(rng.rand(vlen), config.floatX)) f = function([], tensor.exp(x)) print(f.maker.fgraph.toposort()) t0 = time.time() for i in range(iters): r = f() t1 = time.time() print("Looping %d times took %f seconds" % (iters, t1 - t0)) print("Result is %s" % (r,)) if np.any([isinstance(x.op, tensor.Elemwise) for x in f.maker.fgraph.toposort()]): print('Used the cpu') else: print('Used the gpu') ``` 尽管上述代码并非直接涉及 GraphRAG 及 Neo4j 的整合部分，但它展示了如何借助现代机器学习工具链完成复杂的计算任务——这正是我们在开发此类跨平台解决方案时常需面对的工作之一。 ---