关于国产图数据库做graphrag的探索

本人使用过的国产图数据库

本人是多个图数据库的专家认证相对来说,评判会公正客观。本人不偏袒任何一个图数据库,所有观点代表个人在使用中的想法。
同时看完完整探索过程也能理解:为什么近期我在北京的讲座中,对nebula和tugraph使用的相同算法却走了两条路径。

HugeGraph

实现 Apache TinkerPop3 / Gremlin,支持多种后端存储(HBase、Cassandra、RocksDB 等)与多类索引,定位“分析型+快速关联查询”,支持与 Hadoop/Spark 集成及图算法库。

NebulaGraph

分布式原生图数据库,强调“千亿节点、万亿边”水平扩展与毫秒级查询;自研 nGQL(兼容部分 Cypher 风格),支持属性图、索引、图算法组件;有企业版与云服务形态。

TuGraph

面向高性能、分布式事务 + 图分析场景,应用于支付风控等业务;公开材料强调在多项国际基准中表现及万亿级业务实践锤炼。

GES

面向百亿节点/千亿边规模实时多跳查询、风控/推荐/反欺诈等;提供可视化分析界面。

KonisGraph

图数据库 KonisGraph(TencentDB for KonisGraph)是一种云端图数据库服务,基于腾讯在海量图数据上的实践经验,提供一站式海量图数据存储、管理、实时查询、计算、可视化分析能力;KonisGraph 支持属性图模型和 TinkerPop Gremlin 查询语言,能够帮助用户快速完成对图数据的建模、查询和可视化分析。

Graphrag的探索

NebulaGraph的探索阶段

NebulaGraph在 2023 年 8 月与 LlamaIndex 联合提出“Graph RAG”概念,并且我在Nebula中做了初步的尝试。
首先,我们早在23年年初就有过痛点。需要一个机制在确保权限边界与敏感最小暴露的前提下,快速回答“某监管条款在哪些现行合同条款体现并与竞品 X 定价/功能差异是什么”这类跨域多跳问题;目标是:提升合规核查与条款比对效率,减少误用过期条款或未授权资料;支持监管→合同→内部政策→风险指标或竞品功能差异的可追溯路径;对频繁修订保持低成本增量更新与“最新有效”识别;并通过最小必要敏感上下文与回答引用路径满足审计与风险控制。我们尝试了早期的rag方案、微调方案、提示词挂rag通过召回不同提示词来检索不同知识块等。但都难以解决这个需求,一直被压着。
我们看到了NebulaGraph给出的方案后,做出了尝试。我们跑了几个简单的文档,发现了很多问题。诸如:1.如果出现本文档这类信息,那么很多文档都会被当作一个文档实体。 2.

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值