GraphRAG论文阅读笔记
尝试了一阵在B站以视频讲解的形式来记录好的论文。发现自己讲的时候总是脑子跟不上嘴,讲得不清楚,思路理得也不清楚,于是打算还是恢复以博客的形式来记录自己看的论文,我感觉这样还能更清楚的记录自己的绝大多数想法。
摘要
感觉这个摘要还是写得比较符合传统的审美的。
第一句:RAG产生了很广泛的应用(大家普遍认可)
第二句:但是呢,RAG解决不了一类问题。什么问题呢,Query-Focused Summarization(QFS),这类问题比如说问一个Dataset的主题. 因为它不是一个清楚的知识提取的任务。但是传统的QFS系统又无法使用RAG来提升能力(都是大家认可,而且重要的问题)
第三句:所以呢,作者提出了GraphRAG来解决这个问题。
第四句:开始介绍方法了,开始是用LLM来构造一个基于文本的图,第一步是基于文档来提取一个知识图谱,第二步是为每一个community提取一个summary。这样的话,给定一个问题,每一个community summary都能够用于生成一个回答,每一个回答又可以再进行合并,得到一个总的回答。
第五句:实验证明了有效性。
一、引言
用一句流行的话来说,就是我容易被这种以人类智慧为目标的引言击中。
第一段起的很大,就是说人类智慧是可以能够得到一个比文本直接给出的句子所更高级别的结论的(比如问一个Dataset的主题,这个主题很有可能dataset没有一句话直接阐述)。所以呢,在询问一个有关全局的问题的时候,需要一个能够模拟人类心理去给出回答的一个模型。
第二段:虽然RAG很好,但是它要求答案在文本里。但是QFS要求的是给出一个summary而不是给出一些概念。虽然之前专门做summary任务做得很好,但是对于大模型而言,这个还是很难的(因为上下文长度有限制)
第三段:所以QFS在大规模数据集还是很有问题的。(其实我想到了一个事情,就是虽然作者提出了一个很nb的,看起来什么都适用的东

最低0.47元/天 解锁文章
341

被折叠的 条评论
为什么被折叠?



