引言
在大模型时代把知识库和大模型技术相结合的 RAG 技术因为提高搜索和问答的准确性和洞见,帮助企业更好地理解客户需求,提供更个性化和满足客户需求的服务。
传统的基于向量的RAG(Retrieval Augmented Generation)技术在面对海量数据时,常常面临着与互联网早期AltaVista现象相似的问题,即搜索结果准确性低,用户难以快速找到所需信息。本文旨在探讨一种新的基于知识图谱的RAG技术,它被认为是提升智能搜索准确度的关键方向之一。
作为介绍Graph RAG技术的系列文章之一,本文将首先回顾“AltaVista效应”及其解决方案,进而揭示Graph RAG技术在现代搜索中的应用潜力。
1. “AltaVista效应”及谷歌的解决方案
在互联网的早期,用户在进行搜索时常常会遇到一个问题,即“AltaVista效应”。这个效应指的是用户在搜索结果中收到成千上万的网页,其中许多都是不相关的,这使得用户难以找到真正需要的信息。在那个时代,由于互联网内容有限,这个问题并不明显。然而,随着内容的爆炸性增长,这个问题变得越来越严重。
谷歌为了解决“AltaVista效应”,推出了PageRank技术。PageRank是一种图形算法,它通过分析网页之间的链接关系,对网页的重要性进行排名。这种方法侧重