AI 很聪明,但就怕脑子失忆,记忆对AI很重要

AI记忆的重要性与数据库作用

开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,可以解决你的问题。加群请联系 liuaustin3 ,(共3300人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 +9)(1 2 3 4 5 6 7群均已爆满,开8群近400 9群 200+,开10群PolarDB专业学习群100+)

AI系统从讨论已经到了大家都在使用的阶段,而众所周知AI系统的关键问题,或者需要处理好的一个关键问题就是,连续提问的问题,因为AI聪明的,没有记忆。

下面就翻译一篇国外关于AI系统没有记忆的文章。

AI总要的记忆
AI总要的记忆

AI 系统虽然能够生成令人印象深刻的文本、代码和音乐,但它们基本上是“失忆”的。它们一次只处理一个提示,没有长期记忆或个性化学习。例如,如果你问 ChatGPT 上周推荐的食谱,它很可能会给你一个不相关的答案,甚至编造一个答案。大型语言模型(LLM)是无状态的,这意味着它们将每个查询都视为全新的。

然而,这种情况正在改变。所有领先的 LLM 供应商都在探索如何赋予 AI 记忆,这可能会彻底改变 AI 的影响。正如 AI 开发者 Richmond Alake 所说,“AI 中的记忆并非全新概念...但它在现代 AI 智能体中的应用是...革命性的。” 为什么?因为“真正的个性化和长期效用取决于智能体记忆、学习和适应的能力。” 换句话说,真正的智能不仅仅是处理数十亿个词语,更在于在正确的时间回忆起相关信息。

因此,记忆正在成为 AI 缺失的那一块拼图,它可能将今天的“健忘”机器人转变为具有适应能力的伙伴。现在最大的问题是如何为我们的 AI 系统提供这种急需的记忆。解决方案并不那么光鲜亮丽,那就是:数据库。

数据库为 AI 提供了外部记忆 是的,就是数据库。虽然数据库并未出现在当今 AI 行业的热门词汇榜单上,但它们在这些快速变化的趋势背后发挥着重要作用。在传统软件中,数据库一直是真相的来源,是状态和数据的长期存储。现在,在生成式 AI 时代,数据库正在扮演新的角色,成为 AI 技术栈的记忆层。

事实上,向量数据库已经成为生成式 AI 技术栈中不可或缺的一部分,因为它们解决了 LLM 的关键局限性,如幻觉和缺乏持久记忆。通过将知识存储在 AI 可以查询的数据库中,我们有效地为这些模型提供了一个外部大脑,以补充其内置智能。

Alake 概述了思考和使用 AI 记忆的几种关键方式:

角色记忆:存储智能体的身份、性格特征、角色、专业知识和沟通风格。

工具箱记忆:包含工具定义、元数据、参数模式和智能体能力的嵌入。

对话记忆:存储用户与智能体之间的交流历史。

工作流记忆:跟踪多步骤流程的状态。

情景记忆:存储智能体遇到的特定事件或经历。

长期记忆(知识库):为智能体提供持久的背景知识存储。

智能体注册表:一个关于智能体交互实体(如人类、其他智能体或 API)的事实和信息库。

实体记忆:存储智能体在操作过程中与各种实体相关的事实和数据。

工作记忆:作为临时的、活动的处理空间,通过大型语言模型的上下文窗口来实现。

要将这些记忆变为现实,目前最常见的方法是检索增强生成(RAG)。在 RAG 中,AI 从知识库(数据库)中提取相关事实,以支撑其答案。AI 不仅仅依赖于模型训练中包含的内容,还会搜索一个外部存储(通常是向量数据库)来检索最新或详细的信息。这使得系统能够“记住”它从未明确训练过的事情,例如公司的内部文件或特定用户的历史记录,然后将其纳入响应中。

通过用从数据库中获取的数据来增强提示,AI 系统可以随着时间的推移进行连贯的对话,并准确回答特定领域的问题,从而获得超越其固定模型参数的状态和长期记忆。这是一种确保 AI 不会每次都从零开始的方式。它能回忆起之前说过的话,并利用其训练截止日期之外的事实。简而言之,数据库(特别是向量存储)正被证明对 AI 的长期记忆至关重要。

向量、图和混合记忆 当然,并非所有的记忆都是平等的,也并非所有的数据库工作方式都相同。我们正在尝试不同的数据库技术作为 AI 记忆,每种技术都有其优缺点。如前所述,向量数据库是 AI 记忆的典型代表。它们擅长语义相似性搜索,即查找含义相关而不是仅仅通过关键词相关的信息。这使得它们非常适合处理非结构化数据,如文本块:提出一个问题,然后找到最能回答它的段落。

与往常一样,AI 领域曾短暂流行过独立的向量数据库(Weaviate、Pinecone 等)。但这并未持续太久,因为每个主要的数据库供应商(包括 MongoDB 和 Oracle)都为其核心数据库添加了向量搜索功能。这使得开发者可以将向量嵌入与操作数据一起存储。换句话说,应用程序数据库和 AI 记忆存储之间的界限正在模糊。

然而,仅仅是向量搜索并不能解决所有记忆问题。一个局限性是,纯粹的语义相似性可能会忽略上下文,例如时间或关系。一个向量查询可能会找到一个技术上相似但上下文上过时或不相关的几个月前的事实。这就是图数据库发挥作用的地方。知识图谱技术将信息存储为节点和边。可以将其想象成一个由关系连接的事实网络(谁是哪家公司的 CEO,一份文档何时创建等)。这种结构化记忆可以帮助 AI 区分某事发生的时间或事实如何连接。例如,如果你问“你昨天向我推荐了哪家餐厅?”一个基于图的记忆可以根据推荐的具体日期来筛选结果,而不仅仅是语义相似性。因此,图可以提供向量搜索无法提供的时间和上下文感知能力。 它们还提供了可追溯性。你可以通过关系来追踪 AI 提取某个事实的原因,这对于调试和建立信任很有用。像 Zep 这样的初创公司正在探索混合方法,将向量与类似图谱的链接结合起来,以兼顾两者的优点。缺点是,基于图谱的记忆需要定义模式并维护结构化数据,这可能很复杂,而且无法捕捉非结构化文本的所有细微之处。对于许多应用来说,一个简单的向量存储(或支持向量的文档数据库)在易用性和有效性之间取得了很好的平衡。

我们还看到了混合搜索方法:将传统的关键词查询与向量相似性相结合。这种方法可以在进行语义匹配之前,通过元数据(日期范围、用户 ID 或标签)来筛选结果,从而确保 AI“记住”的内容不仅在含义上相关,在上下文中也相关。在实践中,AI 开发者通常会混合使用多种技术:用短期记忆缓冲区来处理最近的交互,用向量数据库来实现长期的语义回忆,有时还会用关系型或文档数据库来存储明确的事实和用户特定数据。这些部分共同构成了一个基本的记忆层级:快速的瞬时记忆(上下文窗口)加上持久的可搜索记忆(数据库)。数据库本质上充当了 AI 的海马体,存储经验和知识,以便在需要时检索,从而为未来的推理提供信息。

终结 AI 的健忘症 尽管人们对神经网络和模型大小津津乐道,但正是朴实无华的数据库——这种记录和交易技术——正在悄然重新定义 AI 的能力。通过接入数据库,我们赋予了 AI 工作记忆和长期记忆。它现在可以保持状态,即时学习新信息,并检索过去的知识来为未来的决策提供信息。这听起来不那么性感,但却是必不可少的。

当然,挑战依然存在。工程师们正在研究如何大规模管理 AI 记忆,决定存储或遗忘哪些信息以防止信息过载,确保相关事实战胜过时数据,并防范“记忆中毒”,即不良数据破坏 AI 的知识。这些都是披着 AI 外衣的经典数据管理问题。解决方案无疑会借鉴数据库科学(事务、索引、缓存)和新技术(更智能的上下文修剪和嵌入模型)。AI 技术栈正在围绕一个核心思想进行整合,那就是模型、数据和记忆必须协同工作。这一切都意味着,下次当一个 AI 助手流畅地回忆起你上次的对话,或者根据你几周前提到的小习惯调整回答时,幕后都有一个数据库在默默地工作,充当着这个机器合成大脑的记忆库。

置顶

从某数据库信任“危机”,简谈危机公关

邦邦硬的PostgreSQL技术干货来了,怎么动态扩展PG内存 !

数据库信创话题能碰吗? 今天斗胆说说

企业出海数据库设计问题一角,与政策动荡下的全球数据库产品

计问题一角,与政策动荡下的全球数据库产品

《数据库江湖邪修门派:心法五式全解》

微软动手了,联合OpenAI + Azure 云争夺AI服务市场

“当复杂的SQL不再需要特别的优化”,邪修研究PolarDB for PG 列式索引加速复杂SQL运行

企业出海“DB”要合规,要不挣那点钱都不够赔的

“合体吧兄弟们!”——从浪浪山小妖怪看OceanBase国产芯片优化《OceanBase “重如尘埃”之歌》

未知黑客通过SQL SERVER 窃取企业SAP核心数据,影响企业运营

那个MySQL大事务比你稳定,主从延迟低,为什么? Look my eyes! 因为宋利兵宋老师

非“厂商广告”的PolarDB课程:用户共创的新式学习范本--7位同学获奖PolarDB学习之星

      说我PG Freezing Boom 讲的一般的那个同学,专帖给你,看看这次可满意

     短评 国产数据库营销市场 “问题”

     这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!

     DBA被瞧不起 你有什么建议? Drive Fast !

OceanBase Hybrid search 能力测试,平换MySQL的好选择

HyBrid Search 实现价值落地,从真实企业的需求角度分析 !不只谈技术!

一个IP地址访问两个PG实例,上演“一女嫁二夫”的戏码

OceanBase 光速快递 OB Cloud “MySQL” 给我,Thanks a lot

从“小偷”开始,不会从“强盗”结束 -- IvorySQL 2025 PostgreSQL 生态大会

被骂后的文字--技术人不脱离思维困局,终局是个 “死” ? ! ......

9

个群2025上半年总结,OB、PolarDB, DBdoctor、爱可生、pigsty、osyun、工作岗位等

卷呀卷,Hybrid 混合查询学习--哪个库是小趴菜

从MySQL不行了,到乙方DBA 给狗,狗都不干? 我干呀!

DBA 干不好容易蹲牢房--这事你知道吗?

SQL SERVER 2025发布了, China幸亏有信创!

MongoDB 麻烦专业点,不懂可以问,别这么用行吗 ! --TTL

P-MySQL SQL优化案例,反观MySQL不死没有天理

MySQL 条件下推与排序优化实例--MySQL8.035

云数据库厂商除了卷技术,下一个阶段还可以卷什么?

PostgreSQL 新版本就一定好--由培训现象让我做的实验

某数据库下的一手好棋!共享存储落子了!

删除数据“八扇屏” 之 锦门英豪  --我去-BigData!

PostgreSQL “乱弹” 从索引性能到开发优化

写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》

SQLSHIFT 是爱可生对OB的雪中送炭!

青春的记忆,MySQL 30年感谢有你,再见!(译)

老实人做的数据库产品,好像也不“老实” !

疯狂老DBA 和 年轻“网红” 程序员 --火星撞地球-- 谁也不是怂货  

哈呀站,OB广州开发者大会 之 “五” 眼联盟

和架构师沟通那种“一坨”的系统,推荐只能是OceanBase,Why ?

OceanBase 相关文章

某数据库下的一手好棋!共享存储落子了!

写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》

     哈呀站,OB广州开发者大会 之 “五” 眼联盟

OceanBase 单机版可以大批量快速部署吗? YES

OceanBase 6大学习法--OBCA视频学习总结第六章

OceanBase 6大学习法--OBCA视频学习总结第五章--索引与表设计

OceanBase 6大学习法--OBCA视频学习总结第五章--开发与库表设计

OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装

OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎

OceanBase 架构学习--OB上手视频学习总结第二章 (OBCA)

OceanBase 6大学习法--OB上手视频学习总结第一章

没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛

OceanBase  送祝福活动,礼物和幸运带给您

跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)

跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)

跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)

跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)

聚焦SaaS类企业数据库选型(技术、成本、合规、地缘政治)

OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB
         MongoDB 相关文章

MongoDB “升级项目” 大型连续剧(4)-- 与开发和架构沟通与扫尾

MongoDB “升级项目” 大型连续剧(3)-- 自动校对代码与注意事项

MongoDB “升级项目” 大型连续剧(2)-- 到底谁是"der"

MongoDB “升级项目”  大型连续剧(1)-- 可“生”可不升

MongoDB  大俗大雅,上来问分片真三俗 -- 4 分什么分

MongoDB 大俗大雅,高端知识讲“庸俗” --3 奇葩数据更新方法

MongoDB 学习建模与设计思路--统计数据更新案例

MongoDB  大俗大雅,高端的知识讲“通俗” -- 2 嵌套和引用

MongoDB  大俗大雅,高端的知识讲“低俗” -- 1 什么叫多模

MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通

MongoDB 年底活动,免费考试名额 7个公众号获得

MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)

MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模

MongoDB  双机热备那篇文章是  “毒”

MongoDB   会丢数据吗?在次补刀MongoDB  双机热备

MONGODB  ---- Austindatabases  历年文章合集

PolarDB 已经开放的课程

PolarDB 非官方课程第八节--数据库弹性弹出一片未来--结课

PolarDB 非官方课程第七节--数据备份还原瞬间完成是怎么做到的--答题领奖品

PolarDB 非官方课程第六节--数据库归档还能这么玩--答题领奖品

PolarDB 非官方课程第五节--PolarDB代理很重要吗?--答题领奖品

PolarDB 非官方课程第四节--PG实时物化视图与行列数据整合处理--答题领奖品

PolarDB 非官方课程第三节--MySQL+IMCI=性能怪兽--答题领奖品

PolarDB 非官方课程第二节--云原生架构与特有功能---答题领奖品

PolarDB 非官方课程第一节-- 用户角度怎么看PolarDB --答题领奖品

免费PolarDB云原生课程,听课“争”礼品,重塑云上知识,提高专业能力

PolarDB 相关文章

数据压缩60%让“PostgreSQL” SQL运行更快,这不科学呀?

这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!

用MySQL 分区表脑子有水!从实例,业务,开发角度分析 PolarDB 使用不会像MySQL那么Low

P-MySQL SQL优化案例,反观MySQL不死没有天理

MySQL 和 PostgreSQL 可以一起快速发展,提供更多的功能?

这个MySQL说“云上自建的MySQL”都是”小垃圾“

        PolarDB MySQL 加索引卡主的整体解决方案

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL 的搅局者问世了,杀过来了!

在被厂商围剿的DBA 求生之路 --我是老油条

POLARDB  添加字段 “卡” 住---这锅Polar不背

PolarDB 版本差异分析--外人不知道的秘密(谁是绵羊,谁是怪兽)

在被厂商围剿的DBA 求生之路 --我是老油条

PolarDB 答题拿-- 飞刀总的书、同款卫衣、T恤,来自杭州的Package(活动结束了)

PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火

PostgreSQL 相关文章

说我PG Freezing Boom 讲的一般的那个同学专帖给你看这次可满意

一个IP地址访问两个PG实例,上演“一女嫁二夫”的戏码

PostgreSQL  Hybrid能力岂非“小趴菜”数据库可比 ?

PostgreSQL 新版本就一定好--由培训现象让我做的实验

PostgreSQL “乱弹” 从索引性能到开发优化

PostgreSQL  无服务 Neon and Aurora 新技术下的新经济模式 (翻译)

PostgreSQL的"犄角旮旯"的参数捋一捋

PostgreSQL逻辑复制槽功能

PostgreSQL 扫盲贴 常用的监控分析脚本

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL  添加索引导致崩溃,参数调整需谨慎--文档未必完全覆盖场景

PostgreSQL 的搅局者问世了,杀过来了!

PostgreSQL SQL优化用兵法,优化后提高 140倍速度

PostgreSQL 运维的难与“难”  --上海PG大会主题记录

PostgreSQL 什么都能存,什么都能塞 --- 你能成熟一点吗?

PostgreSQL 迁移用户很简单 ---  我看你的好戏

PostgreSQL 用户胡作非为只能受着 --- 警告他

全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始
PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁

PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!

病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)

PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜

PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆

PostgreSQL 如何通过工具来分析PG 内存泄露

PostgreSQL  分组查询可以不进行全表扫描吗?速度提高上千倍?

POSTGRESQL --Austindatabaes 历年文章整理

PostgreSQL  查询语句开发写不好是必然,不是PG的锅

PostgreSQL  字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"

PostgreSQL  Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)

PostgreSQL   玩PG我们是认真的,vacuum 稳定性平台我们有了

PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)

DBA 失职导致 PostgreSQL 日志疯涨

MySQL相关文章

MySQL 条件下推与排序优化实例--MySQL8.035

青春的记忆,MySQL 30年感谢有你,再见!(译)

MySQL 8 SQL 优化两则 ---常见问题

MySQL SQL优化快速定位案例 与 优化思维导图

"DBA 是个der" 吵出MySQL主键问题多种解决方案

MySQL 怎么让自己更高级---从内存表说到了开发方式

MySQL timeout 参数可以让事务不完全回滚

MySQL 让你还用5.7 出事了吧,用着用着5.7崩了

MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验

用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊

MYSQL  --Austindatabases 历年文章合集

临时工访谈系列

没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛

ETL 行业也够卷,云化ETL,ETL 软件不过了

SQL SERVER 系列

SQL SERVER维保AI化,从一段小故事开始

SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗

SQL SERVER 危险中,标题不让发,进入看详情(译)

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值