RAG进阶：混合稠密检索和知识图谱来提升精度

最新推荐文章于 2025-04-25 21:09:05 发布

OpenMMLab

最新推荐文章于 2025-04-25 21:09:05 发布

阅读量1k

点赞数 8

分类专栏：技术干货文章标签：知识图谱人工智能大模型 ai 开源

本文链接：https://blog.youkuaiyun.com/qq_39967751/article/details/141034471

版权

HuixiangDou 是群聊场景的 LLM 知识助手。群里人多口杂，机器人显然不应该答复所有消息，它的设计规则为：

无关内容不吭声——拒答
明确该答的，直接回复——检索
不能违反核心价值观——可靠

https://github.com/InternLM/HuixiangDou（觉得好用欢迎 star）

在上一篇文章中，我们用真实群聊数据测试，对比不同方法和调参，最终拒答 F1 score 达到 75.88。

本文介绍如何混用知识图谱和稠密检索，把 F1 进一步提升到 77.57。

以下是目前所有方法对比：

方法	F1 score	备注
BCE+KG混合（本文）	77.57	KG 权重约 20%
BCE	75.88	需配合特定 splitter

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

OpenMMLab

关注关注

8
点赞
踩
30

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

RAG模型的知识图谱扩展：方法和技巧

AI天才研究院

03-09

653

1. 背景介绍 1.1 什么是知识图谱 知识图谱（Knowledge Graph）是一种结构化的知识表示方法，它以图的形式表示实体（Entity）之间的关系。知识图谱的核心是实体和关系，实体是知识图谱中的节点，关系是连接实体的边。知识图谱可以用于表示复杂的知识体系，为人工智能、自然语言处理、推荐系统等

WeKnow-RAG:知识图谱赋能的智能检索增强生成系统

步子哥的博客

08-31

909

WeKnow-RAG的出现,让我们看到了AI系统在处理复杂知识方面的巨大潜力。它不仅仅是技术的进步,更是对人类知识组织和利用方式的一种全新探索。正如艾萨克·阿西莫夫所说:"科学搜集事实,就像从沙滩上搜集鹅卵石一样。但科学的真正特质不是搜集事实,而是用事实解释其他事实。"WeKnow-RAG正是朝着这个方向迈出了重要一步,它不仅能搜集信息,更能理解信息之间的联系,从而产生更深刻的洞察。在这个信息爆炸的时代,我们不缺乏数据,缺乏的是将数据转化为有用知识的能力。

参与评论您还未登录，请先登录后发表或查看评论

【AI落地应用实战】RAGFlow + 知识图谱 + Deepseek 初步探索

python1234_的博客

03-18

2245

人们对。

在大模型RAG系统中应用知识图谱

我相信......

02-25

3020

【引子】关于大模型及其应用方面的文章层出不穷，聚焦于自己面对的问题，有针对性的阅读会有很多的启发，本文源自Whyhow.ai 上的一些文字和示例。对于在大模型应用过程中如何使用知识图谱比较有参考价值，特汇总分享给大家。在基于大模型的RAG应用中，可能会出现不同类型的问题，通过知识图谱的辅助可以在不同阶段增强RAG的效果，并具体说明在每个阶段如何改进答案和查询。知识图谱更类似于结构化数据存储，而不...

为什么说知识图谱 + RAG ＞传统 RAG？

金融机器智能社区

07-23

1667

你是否曾觉得自己的大脑充斥了一团乱麻般的随机事实？知识图谱模拟了我们大脑思考事物，以及事物间关系的方式，同时又规避了大脑会遗忘和错误决策等问题。我们可以将知识图谱视为带了主语、谓语和宾语的三元组。它们将信息表示为一个由相互连接的实体组成的网络，以及实体之间的关系。本质上，知识图谱利用基于图的数据模型，其中节点代表实体（如人、地点或概念的主体和宾语），边表示这些实体之间的关系或谓语。OpenSPG 是一个语义增强的可编程知识图谱，GitHub地址如下，欢迎大家Star关注~

GraphRag实战篇：RAG+知识图谱，提升模型推理能力的大杀器，值得收藏！

2401_85378759的博客

12-25

4121

前言经典RAG应用的范式与架构已经非常流行，我们可以在很短的时间内借助成熟框架开发一个简单能用的RAG应用。但是传统的RAG系统有个非常大的局限，即不善于处理复杂关系推理、总结性问题和多跳问题。因为传统RAG需要对文本进行分块，然后进行向量化存储，这种处理模式就会天然导致RAG在全局查询或总结上的表现不会太好。比如面对这样的问题，“《跨越鸿沟》这本书整体上讲了什么？请撰写一份2000字的总结”，传统RAG大概率会表现不及格。同样的，在对文本分块之后，可能会丢失一些信息之间的关系和因果性，因此在处理多跳问题时

检索增强生成（RAG）与知识图谱：结合自然语言处理与知识表示的前沿技术

威哥说编程

12-05

1049

检索增强生成（RAG）是一种结合了生成式和检索式模型的混合型方法。其核心思想是，在生成模型进行回答或生成任务之前，先通过一个检索模块从大量的外部文档或知识库中检索相关信息，然后将这些检索到的信息输入到生成模型中，辅助生成更精确和相关的答案或内容。传统的生成式模型（如GPT）在生成时仅依赖于其训练数据中的知识，而检索增强生成则通过引入外部知识源来弥补这一限制。这种方法能够显著提高生成任务的准确性和信息的相关性，尤其是在处理动态更新的信息时。

善用知识图谱，问答助手只“解惑”，不“闲聊”

ShushengPuyu的博客

08-02

1829

作为聊天工具，机器人越来越多地被应用于群聊中。但是群聊场景中往往存在信息繁杂、消息泛滥等情况。聊天机器人如何应对？作为一款基于大语言模型的知识问答AI助手，茴香豆（HuixiangDou）可被部署在社交软件群聊中，避免无效的“闲聊”，更高效地帮助用户答疑解惑。开源以来，得益于准确检索、低成本部署等优势，茴香豆受到开发者广泛好评。

知识图谱和RAG如何结合？

百态老人的博客

08-18

1073

从原始文本中提取知识图谱：GraphRAG首先将非结构化文档转换为结构化的知识图谱，这包括节点和关系的组织。构建社区层次结构：在知识图谱的基础上，GraphRAG进一步构建社区层次结构。这些社区是基于相似主题或内容的集合，有助于更好地理解和组织信息。为社区生成摘要：针对每个社区，GraphRAG会生成相应的摘要，以提供更高效、准确的信息检索和总结能力。利用RAG任务执行时的结构：在实际应用中，GraphRAG会在执行基于检索增强生成（RAG）的任务时利用这些社区层次结构和生成的摘要，从而提升整体性能。

一文搞懂GraphRAG（RAG + 知识图谱）

最新发布

m0_59235699的博客

04-25

1087

输入：近五年AI领域文献数据。

RAG | 使用知识图谱和大模型把书读透了

m0_59163425的博客

07-30

1269

今天，既不讲技术，也不讲产品，就是分享一个有意思的事情。读书、学习、做研究、学以致用做产出是每个人在知识领域的循环。作为一个重度的知识工作者，梦想有一个聪明的助手帮我们来“读书、理解”，最好能以费曼的方式和我们探讨，甚至最终和我们协作一起搞创造。最近，我们做了一个实验，应用当前关注的RAG结合提取出的知识图谱来读书，发现结果很有意思。当然，为了和人类能够交互，需要一个大模型和我们进行问答。考虑到未来可能的。

整合文本和知识图谱嵌入提升RAG的性能

deephub

05-03

4513

在(RAG)中同时使用文本嵌入和知识嵌入可以从几个方面增强模型的性能和能力:1、文本嵌入捕获单个单词或短语的语义，而知识嵌入捕获实体之间的明确关系。通过两种嵌入的集成，RAG模型实现了对输入文本和存储在知识图中的组织信息的更全面的把握。2、文本嵌入通过分析输入文本中的词共现提供有价值的上下文见解，而知识嵌入通过检查知识图中实体之间的关系提供上下文相关性。通过组合不同类型的嵌入，RAG模型能够生成与输入文本在语义上相关且在上下文中与结构化知识一致的响应。

从传统 RAG 到知识图谱 RAG

xx_nm98的博客

06-27

2132

众所周知，大型语言模型（LLM）在固定数据集上运行，其知识在上次训练更新时被冻结。ChatGPT 的普通用户可能会认识到众所周知的限制：“截至 2021 年 9 月的训练数据”。这种限制可能导致不准确或过时的响应，因为这些模型会“幻觉”信息。在不进行再培训或微调的情况下，用新信息更新它们或增强上下文理解在资源和人力方面都可能具有挑战性。

突破传统RAG局限：GraphRAG如何提升大模型问答能力？

xx_nm98的博客

10-25

731

大模型存在不可避免的幻觉问题，这正是RAG（检索增强生成）发挥作用的地方。RAG通过连接外部数据源，将事实型知识引入大模型。但是，传统基于向量的RAG仍有其局限性，传统RAG是将数据分解成文本块，并独立检索这些片段，这可能导致遗漏信息片段之间的关系，缺乏全局视角。GraphRAG是一种正在兴起的RAG技术，利用知识图谱来表示数据和元数据，同时还可以将文本或节点嵌入到图中。GraphRAG通过将知识图谱融入检索过程，提升传统RAG的性能，更好地理解语义关联。

GraphRAG：知识图谱+RAG技术