对高效且轻量级 的RAG系统需求日益增长,但RAG框架中部署**小型语言模型(SLMs)**在语义理解和文本处理上存在局限,阻碍了广泛应用。
与 LLMs 相比,SLMs 在索引和回答阶段都显示出显著的局限性 。左侧 :SLMs生成的描述质量明显低于LLMs。右侧 :SLMs难以在大篇幅的上下文中找到相关信息,而LLMs则能有效地完成这项任务。

为此,香港大学提出并开源 了MiniRAG ,这是一种专为极简和高效 而设计的新型RAG系统。
MiniRAG架构解决了设备端 RAG 系统面临的独特挑战,在效率和效果之间实现了优化

MiniRAG引入了两项关键技术创新:(1)一种语义感知的异构图索引机制 ,将文本块和命名实体结合在一个统一结构中,减少了对复杂语义理解的依赖;(2)一种轻量级的拓扑增强检索方法 ,利用图结构实现高效的知识发现,而无需高级语言能力。
语义感知的异构图索引机制
-
构建过程:
-
文本预处理:对文本进行分句和分词处理。
-
实体识别:利用预训练的命名实体识别(NER)模型识别文本中的命名实体。
-
图构建:将文本片段和命名实体作为节点,根据共现关系构建边,形成

最低0.47元/天 解锁文章
1311

被折叠的 条评论
为什么被折叠?



