GraphRAG综述

甲甲不假假

于 2024-10-23 22:52:09 发布

阅读量388

点赞数 5

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_67031452/article/details/142142965

版权

GraphRAG

传统RAG的局限性

忽视关系 ：文本内容通常并非孤立而是相互关联的。传统的 RAG 无法捕获，仅靠语义相似性无法呈现的重要结构化关系知识。比如，在通过引用关系连接论文的引用网络中，传统的 RAG 方法侧重于依据查询找到相关论文，却忽略了论文之间重要的引用关系。
冗余信息 ：RAG 在连接成提示时，常以文本片段的形式重复内容，致使上下文过长，陷入“Lost in the Middle”的困境。Lost in the Middle：在处理需要识别相关上下文的信息的任务（文档问答、键值对索引）时，大模型对相关信息的位置很敏感；当相关的信息在输入prompt的开头或者结尾时，能够取得较好的效果，而当相关的信息在prompt中间部分时，性能会显著下降。
缺乏全局信息 ：RAG 只能检索文档的子集，无法全面掌握全局信息，因而在诸如查询聚焦摘要（Query-Focused Summarization，QFS）等任务中表现不佳。

概念

graphRAG是将知识库被表示为一个由实体（例如人物、地点、事件等）和这些实体之间的关系组成的网络。graphRAG从知识库中中检索包含与给定查询相关的关系知识的图元素，这些元素可能包括用于生成响应的节点、三元组、路径或子图。

三元组（Triple）是知识图谱中用于表示实体（Entities）及其相互关系（Relations）的基本数据单位，通常由主体，谓语，客体构成。

Text-Attributed Graphs，简称TAG，是文本属性图的英文表达。它是 GraphRAG 中使用的图形数据的通用和通用格式。

技术逻辑

基于图的索引（G-Indexing）

识别或构建图数据库，并在其基础上建立索引，索引过程通常涵盖映射节点和边的属性，在相互连接的节点间建立指针，以及组织数据以支持快速遍历和检索操作。索引决定了后续检索阶段的精细程度。

图引导检索（G-Retrieval）

根据用户的查询或输入从图形数据库中提取相关信息，在知识图谱中提取最相关的元素（例如，实体、三元组、路径、子图）

图增强生成（G-Generation）

甲甲不假假

博客等级

码龄3年

15
原创

229
点赞

245
收藏

162
粉丝

关注

私信

热门文章

上一篇：: 数据结构与算法学习记录

下一篇：: Transformer相关知识

最新评论

机器学习相关数学知识
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)使用更多的站内链接；(3)提升标题与正文的相关性。
NVIDIA JETSON AGX XAVIER 刷机后启动不了
_____Me_____: 先出Nvidia再刷命令行然后输入不支持黑屏，换了不同型号显示屏好了，后来尝试换HDMI线发现也行
NVIDIA JETSON TX2 开机黑屏处理方案
Kody.千茗: 请问开机之后黑色窗口一直闪烁报错：not writing throught dangling symlink ‘etc/resol 如何解决呀
Jetson nano （重装）从零开始的最详细基础配置
甲甲不假假: 我感觉不是没有格式化是问题，你可以再格式化再烧录一下试试，我还有另外一篇开机不显示的文章你可以参考一下
NVIDIA JETSON AGX XAVIER 刷机后启动不了
甲甲不假假: 记不得了我好像没选最新的用了一个久一点的版本

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。