LLM应用实战：当KBQA集成LLM(二)

最新推荐文章于 2026-01-04 15:04:11 发布

原创

最新推荐文章于 2026-01-04 15:04:11 发布 · 1.3k 阅读

CC 4.0 BY-SA版权

文章标签：

本文是KBQA集成LLM项目的阶段性总结，针对上次提到的数据落库和属性值查实体问题进行优化。数据库选型为Es，介绍了表结构设计、安装部署及采坑解决办法，还给出Es操作相关源码，最终解决了基于属性值查找实体的问题，效果得到提升。

1. 背景

又两周过去了，本qiang~依然奋斗在上周提到的项目KBQA集成LLM，感兴趣的可通过传送门查阅先前的文章《LLM应用实战：当KBQA集成LLM》。

本次又有什么更新呢？主要是针对上次提到的缺点进行优化改进。主要包含如下方面：

1. 数据落库

上次文章提到，KBQA服务会将图谱的概念、属性、实体、属性值全部加载到内存，所有的查询均在内存中进行，随之而来的问题就是如果图谱的体量很大呢，那内存不爆了么…

2. 支持基于属性值查实体

上篇文章不支持属性值查找实体，比如”最会照顾宝宝的是什么龙”，”什么龙是大龙和大龙生活，小龙和小龙生活”。本次已经此问题优化。

此篇文章是对这两周工作的一个整体总结，其中包含部分工程层面的优化。

整体框架和上篇大致相同，不同之处在于：

1. 对齐模块：先前是基于SIM筛选候选实体，本次基于ES进行候选实体召回

2. 解析模块：先前是基于hugegraph和内存中的实体信息进行解析，本次优化为基于hugegraph和elasticsearch

由于需要支撑语义相似度检索，因此数据库选型为Milvus与Elasticsearch。

二者之间的比对如下：