❝开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,可以解决你的问题。加群请联系 liuaustin3 ,(共3300人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 +9)(1 2 3 4 5 6 7群均已爆满,开8群近400 9群 200+,开10群PolarDB专业学习群100+)
AI系统从讨论已经到了大家都在使用的阶段,而众所周知AI系统的关键问题,或者需要处理好的一个关键问题就是,连续提问的问题,因为AI聪明的,没有记忆。
下面就翻译一篇国外关于AI系统没有记忆的文章。
AI 系统虽然能够生成令人印象深刻的文本、代码和音乐,但它们基本上是“失忆”的。它们一次只处理一个提示,没有长期记忆或个性化学习。例如,如果你问 ChatGPT 上周推荐的食谱,它很可能会给你一个不相关的答案,甚至编造一个答案。大型语言模型(LLM)是无状态的,这意味着它们将每个查询都视为全新的。
然而,这种情况正在改变。所有领先的 LLM 供应商都在探索如何赋予 AI 记忆,这可能会彻底改变 AI 的影响。正如 AI 开发者 Richmond Alake 所说,“AI 中的记忆并非全新概念...但它在现代 AI 智能体中的应用是...革命性的。” 为什么?因为“真正的个性化和长期效用取决于智能体记忆、学习和适应的能力。” 换句话说,真正的智能不仅仅是处理数十亿个词语,更在于在正确的时间回忆起相关信息。
因此,记忆正在成为 AI 缺失的那一块拼图,它可能将今天的“健忘”机器人转变为具有适应能力的伙伴。现在最大的问题是如何为我们的 AI 系统提供这种急需的记忆。解决方案并不那么光鲜亮丽,那就是:数据库。
数据库为 AI 提供了外部记忆 是的,就是数据库。虽然数据库并未出现在当今 AI 行业的热门词汇榜单上,但它们在这些快速变化的趋势背后发挥着重要作用。在传统软件中,数据库一直是真相的来源,是状态和数据的长期存储。现在,在生成式 AI 时代,数据库正在扮演新的角色,成为 AI 技术栈的记忆层。
事实上,向量数据库已经成为生成式 AI 技术栈中不可或缺的一部分,因为它们解决了 LLM 的关键局限性,如幻觉和缺乏持久记忆。通过将知识存储在 AI 可以查询的数据库中,我们有效地为这些模型提供了一个外部大脑,以补充其内置智能。
Alake 概述了思考和使用 AI 记忆的几种关键方式:
角色记忆:存储智能体的身份、性格特征、角色、专业知识和沟通风格。
工具箱记忆:包含工具定义、元数据、参数模式和智能体能力的嵌入。
对话记忆:存储用户与智能体之间的交流历史。
工作流记忆:跟踪多步骤流程的状态。
情景记忆:存储智能体遇到的特定事件或经历。
长期记忆(知识库):为智能体提供持久的背景知识存储。
智能体注册表:一个关于智能体交互实体(如人类、其他智能体或 API)的事实和信息库。
实体记忆:存储智能体在操作过程中与各种实体相关的事实和数据。
工作记忆:作为临时的、活动的处理空间,通过大型语言模型的上下文窗口来实现。
要将这些记忆变为现实,目前最常见的方法是检索增强生成(RAG)。在 RAG 中,AI 从知识库(数据库)中提取相关事实,以支撑其答案。AI 不仅仅依赖于模型训练中包含的内容,还会搜索一个外部存储(通常是向量数据库)来检索最新或详细的信息。这使得系统能够“记住”它从未明确训练过的事情,例如公司的内部文件或特定用户的历史记录,然后将其纳入响应中。
通过用从数据库中获取的数据来增强提示,AI 系统可以随着时间的推移进行连贯的对话,并准确回答特定领域的问题,从而获得超越其固定模型参数的状态和长期记忆。这是一种确保 AI 不会每次都从零开始的方式。它能回忆起之前说过的话,并利用其训练截止日期之外的事实。简而言之,数据库(特别是向量存储)正被证明对 AI 的长期记忆至关重要。
向量、图和混合记忆 当然,并非所有的记忆都是平等的,也并非所有的数据库工作方式都相同。我们正在尝试不同的数据库技术作为 AI 记忆,每种技术都有其优缺点。如前所述,向量数据库是 AI 记忆的典型代表。它们擅长语义相似性搜索,即查找含义相关而不是仅仅通过关键词相关的信息。这使得它们非常适合处理非结构化数据,如文本块:提出一个问题,然后找到最能回答它的段落。
与往常一样,AI 领域曾短暂流行过独立的向量数据库(Weaviate、Pinecone 等)。但这并未持续太久,因为每个主要的数据库供应商(包括 MongoDB 和 Oracle)都为其核心数据库添加了向量搜索功能。这使得开发者可以将向量嵌入与操作数据一起存储。换句话说,应用程序数据库和 AI 记忆存储之间的界限正在模糊。
然而,仅仅是向量搜索并不能解决所有记忆问题。一个局限性是,纯粹的语义相似性可能会忽略上下文,例如时间或关系。一个向量查询可能会找到一个技术上相似但上下文上过时或不相关的几个月前的事实。这就是图数据库发挥作用的地方。知识图谱技术将信息存储为节点和边。可以将其想象成一个由关系连接的事实网络(谁是哪家公司的 CEO,一份文档何时创建等)。这种结构化记忆可以帮助 AI 区分某事发生的时间或事实如何连接。例如,如果你问“你昨天向我推荐了哪家餐厅?”一个基于图的记忆可以根据推荐的具体日期来筛选结果,而不仅仅是语义相似性。因此,图可以提供向量搜索无法提供的时间和上下文感知能力。 它们还提供了可追溯性。你可以通过关系来追踪 AI 提取某个事实的原因,这对于调试和建立信任很有用。像 Zep 这样的初创公司正在探索混合方法,将向量与类似图谱的链接结合起来,以兼顾两者的优点。缺点是,基于图谱的记忆需要定义模式并维护结构化数据,这可能很复杂,而且无法捕捉非结构化文本的所有细微之处。对于许多应用来说,一个简单的向量存储(或支持向量的文档数据库)在易用性和有效性之间取得了很好的平衡。
我们还看到了混合搜索方法:将传统的关键词查询与向量相似性相结合。这种方法可以在进行语义匹配之前,通过元数据(日期范围、用户 ID 或标签)来筛选结果,从而确保 AI“记住”的内容不仅在含义上相关,在上下文中也相关。在实践中,AI 开发者通常会混合使用多种技术:用短期记忆缓冲区来处理最近的交互,用向量数据库来实现长期的语义回忆,有时还会用关系型或文档数据库来存储明确的事实和用户特定数据。这些部分共同构成了一个基本的记忆层级:快速的瞬时记忆(上下文窗口)加上持久的可搜索记忆(数据库)。数据库本质上充当了 AI 的海马体,存储经验和知识,以便在需要时检索,从而为未来的推理提供信息。
终结 AI 的健忘症 尽管人们对神经网络和模型大小津津乐道,但正是朴实无华的数据库——这种记录和交易技术——正在悄然重新定义 AI 的能力。通过接入数据库,我们赋予了 AI 工作记忆和长期记忆。它现在可以保持状态,即时学习新信息,并检索过去的知识来为未来的决策提供信息。这听起来不那么性感,但却是必不可少的。
当然,挑战依然存在。工程师们正在研究如何大规模管理 AI 记忆,决定存储或遗忘哪些信息以防止信息过载,确保相关事实战胜过时数据,并防范“记忆中毒”,即不良数据破坏 AI 的知识。这些都是披着 AI 外衣的经典数据管理问题。解决方案无疑会借鉴数据库科学(事务、索引、缓存)和新技术(更智能的上下文修剪和嵌入模型)。AI 技术栈正在围绕一个核心思想进行整合,那就是模型、数据和记忆必须协同工作。这一切都意味着,下次当一个 AI 助手流畅地回忆起你上次的对话,或者根据你几周前提到的小习惯调整回答时,幕后都有一个数据库在默默地工作,充当着这个机器合成大脑的记忆库。
置顶
邦邦硬的PostgreSQL技术干货来了,怎么动态扩展PG内存 !
微软动手了,联合OpenAI + Azure 云争夺AI服务市场
“当复杂的SQL不再需要特别的优化”,邪修研究PolarDB for PG 列式索引加速复杂SQL运行
“合体吧兄弟们!”——从浪浪山小妖怪看OceanBase国产芯片优化《OceanBase “重如尘埃”之歌》
未知黑客通过SQL SERVER 窃取企业SAP核心数据,影响企业运营
那个MySQL大事务比你稳定,主从延迟低,为什么? Look my eyes! 因为宋利兵宋老师
非“厂商广告”的PolarDB课程:用户共创的新式学习范本--7位同学获奖PolarDB学习之星
说我PG Freezing Boom 讲的一般的那个同学,专帖给你,看看这次可满意
这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!
OceanBase Hybrid search 能力测试,平换MySQL的好选择
HyBrid Search 实现价值落地,从真实企业的需求角度分析 !不只谈技术!
OceanBase 光速快递 OB Cloud “MySQL” 给我,Thanks a lot
从“小偷”开始,不会从“强盗”结束 -- IvorySQL 2025 PostgreSQL 生态大会
被骂后的文字--技术人不脱离思维困局,终局是个 “死” ? ! ......
个群2025上半年总结,OB、PolarDB, DBdoctor、爱可生、pigsty、osyun、工作岗位等
从MySQL不行了,到乙方DBA 给狗,狗都不干? 我干呀!
SQL SERVER 2025发布了, China幸亏有信创!
MongoDB 麻烦专业点,不懂可以问,别这么用行吗 ! --TTL
PostgreSQL 新版本就一定好--由培训现象让我做的实验
删除数据“八扇屏” 之 锦门英豪 --我去-BigData!
写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》
疯狂老DBA 和 年轻“网红” 程序员 --火星撞地球-- 谁也不是怂货
和架构师沟通那种“一坨”的系统,推荐只能是OceanBase,Why ?
OceanBase 相关文章
写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》
OceanBase 6大学习法--OBCA视频学习总结第六章
OceanBase 6大学习法--OBCA视频学习总结第五章--索引与表设计
OceanBase 6大学习法--OBCA视频学习总结第五章--开发与库表设计
OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装
OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎
OceanBase 架构学习--OB上手视频学习总结第二章 (OBCA)
OceanBase 6大学习法--OB上手视频学习总结第一章
没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛
跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)
跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)
跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)
跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)
OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB
MongoDB 相关文章
MongoDB “升级项目” 大型连续剧(4)-- 与开发和架构沟通与扫尾
MongoDB “升级项目” 大型连续剧(3)-- 自动校对代码与注意事项
MongoDB “升级项目” 大型连续剧(2)-- 到底谁是"der"
MongoDB “升级项目” 大型连续剧(1)-- 可“生”可不升
MongoDB 大俗大雅,上来问分片真三俗 -- 4 分什么分
MongoDB 大俗大雅,高端知识讲“庸俗” --3 奇葩数据更新方法
MongoDB 大俗大雅,高端的知识讲“通俗” -- 2 嵌套和引用
MongoDB 大俗大雅,高端的知识讲“低俗” -- 1 什么叫多模
MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通
MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)
MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模
MongoDB 双机热备那篇文章是 “毒”
MongoDB 会丢数据吗?在次补刀MongoDB 双机热备
MONGODB ---- Austindatabases 历年文章合集
PolarDB 已经开放的课程
PolarDB 非官方课程第八节--数据库弹性弹出一片未来--结课
PolarDB 非官方课程第七节--数据备份还原瞬间完成是怎么做到的--答题领奖品
PolarDB 非官方课程第六节--数据库归档还能这么玩--答题领奖品
PolarDB 非官方课程第五节--PolarDB代理很重要吗?--答题领奖品
PolarDB 非官方课程第四节--PG实时物化视图与行列数据整合处理--答题领奖品
PolarDB 非官方课程第三节--MySQL+IMCI=性能怪兽--答题领奖品
PolarDB 非官方课程第二节--云原生架构与特有功能---答题领奖品
PolarDB 非官方课程第一节-- 用户角度怎么看PolarDB --答题领奖品
免费PolarDB云原生课程,听课“争”礼品,重塑云上知识,提高专业能力
PolarDB 相关文章
数据压缩60%让“PostgreSQL” SQL运行更快,这不科学呀?
这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!
用MySQL 分区表脑子有水!从实例,业务,开发角度分析 PolarDB 使用不会像MySQL那么Low
MySQL 和 PostgreSQL 可以一起快速发展,提供更多的功能?
“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!
POLARDB 添加字段 “卡” 住---这锅Polar不背
PolarDB 版本差异分析--外人不知道的秘密(谁是绵羊,谁是怪兽)
PolarDB 答题拿-- 飞刀总的书、同款卫衣、T恤,来自杭州的Package(活动结束了)
PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火
PostgreSQL 相关文章
说我PG Freezing Boom 讲的一般的那个同学专帖给你看这次可满意
PostgreSQL Hybrid能力岂非“小趴菜”数据库可比 ?
PostgreSQL 新版本就一定好--由培训现象让我做的实验
PostgreSQL 无服务 Neon and Aurora 新技术下的新经济模式 (翻译)
“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!
PostgreSQL 添加索引导致崩溃,参数调整需谨慎--文档未必完全覆盖场景
PostgreSQL SQL优化用兵法,优化后提高 140倍速度
PostgreSQL 运维的难与“难” --上海PG大会主题记录
PostgreSQL 什么都能存,什么都能塞 --- 你能成熟一点吗?
全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始
PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁
PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!
病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)
PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜
PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆
PostgreSQL 分组查询可以不进行全表扫描吗?速度提高上千倍?
POSTGRESQL --Austindatabaes 历年文章整理
PostgreSQL 查询语句开发写不好是必然,不是PG的锅
PostgreSQL 字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"
PostgreSQL Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)
PostgreSQL 玩PG我们是认真的,vacuum 稳定性平台我们有了
PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)
MySQL相关文章
MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验
用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊
MYSQL --Austindatabases 历年文章合集
临时工访谈系列
没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛
SQL SERVER 系列
SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗

AI记忆的重要性与数据库作用

被折叠的 条评论
为什么被折叠?



