Rag与ai agent

原创已于 2025-08-19 23:55:29 修改 · 154 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

于 2025-08-13 08:05:51 首次发布

1.agent叫智能体协同了mcp协议与大模型来更好的完成需求任务，Rag叫检索增强把知识库分片向量化存储（在redis vector中）每次搜索向量化搜索内容为向量通过相似性算法中的粗排和重排召回符合预期的答案

2简单来说就是工作中用大模型对应的应用体会存在你问几句他就忘记前文或者ai幻觉的情况。

因为你使用的是云端的大模型智能体，他知识库同时涉及数不尽的领域有很多人同时用，导致他的redis向量存储匮乏只能存最新的几条。

在面对特定领域的长期难题会显得力不从心，因此对于每个行业甚至是每个公司而言都会想面向自己的知识库和业务体系构建一个按照自己逻辑处理，且结合自己公司知识库能在会话中几乎存储无限历史记录来作为参考解决问题的垂直智能系统。

3.概括来说ai幻觉就是检索不到或者分不清就瞎编

检索不到可以补充实时rag数据库提供语义可选项进行相似性比对但是如果只有语料只去比较相似度有可能逻辑不合比如说问的是“吃什么了” 相似性比对只基于语义可能就会给返回“我吃了” 因此如果要解决这方面的问题就要引入大模型微调来进行某一些业务的特定训练给他梳理某一方面从相似语义中选择符合逻辑的回答的能力从线性代数的角度来说，你关于少部分领域进行训练会导致这少部分领域k个必要向量增长那模型本身其他与这k个向量夹角大于90°的会因为投影相反为度下降也就是不敏感甚至会因为小于阈值无法识别其他通用的

废话不多说由于我现在设备有点简陋就开始从零搞一个简单的ai代理或者智能体入个行

3.这个apikey如果是ollama好像不需要apikey

可以看到本地部署成功了：

4.用搭建好的前端终于能实现了一个最简单的本地agent 但是它的功能满足不了我们搭建的目的

及长期记忆与垂直知识库保证他能长久思考困难问题所以接下来要做的事实现数据库然后在搭建知识库这里分两步走：

5.数据库：

这个advisor 就相当于拦截器或者springcloud gatway中的globalfliter在这里before阶段处理存储会话记忆用memoryadvisor封装如下效果此时没有存储驱动可能效果一般：

下图显示注入chatclient的和controller的记忆规则是20 要大于某些通用大模型应用但是20 条对话历史 默认存储在 JVM 内存，通过 ConcurrentHashMap管理，依赖 conversationId隔离会话。重启应用会导致数据丢失，适合开发测试环境也就是说java停止运行都会丢失记忆