❝开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,可以解决你的问题。加群请联系 liuaustin3 ,(共3300人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 +9)(1 2 3 4 5 6 7群均已爆满,开8群近400 9群 200+,开10群PolarDB专业学习群 7月份开课 已开课4节 100+)
云是下一代IT工作者的主要阵地,基于前瞻性和未来的发展,尤其在数据库云化越来越严重的今天,世界性的企业上迁到云上的趋势非常的明显了,集约式的工作方式,你去问一个企业,你是愿意在经济前景不明朗的今天,自己的购买主机,网络设备,雇佣一堆的基础设施建设的人,还是只需要一根网线,就可以和世界进行连接,事实已经给我们答案了。
在上个月某会议我扎心的几句,其中我问到我的老板要求用数据库的时候就缴费,不用的时候就不缴费,咱们可以做到吗? 一位老师“委婉”简单的说了这个原理与他对云企业的资源管理的担心,弹性对于云企业对于资源的管控是一个大的挑战。
是的云企业对于云上资源的超卖和防止其出现问题是需要做很多的工作,SIGMOD国际计算机学会的数据库管理特别兴趣小组的会议 2025年的召开地是“德国柏林”,而此次中国的云企业针对云企业切实的云资源管理问题,给出了一个研究成果。此研究成果已经在世界级的IT杂志刊登,以下为相关的译文:

SIGMOD 是国际计算机学会的数据管理特别兴趣小组,专门研究大规模数据管理问题和数据库。
始于 1975 年的年度 ACM SIGMOD 会议被认为是该领域最重要的会议之一。虽然传统上该会议一直在北美举行,但它于 2004 年在巴黎、2007 年在北京、2011 年在雅典和 2015 年在墨尔本举行。1996 年至 2012 年 ACM SIGMOD 会议的平均接受率为 18%,2012 年为 17%。[1]2 SIGMOD 与SIGACT和SIGAI联合,还赞助了关于数据库系统理论方面的年度 ACM数据库系统原理研讨会(PODS)会议。PODS 始于 1982 年,自 1991 年以来一直与 SIGMOD 会议联合举行。[2]6 每年,该小组都会颁发几个奖项来表彰对数据管理领域的贡献。其中最重要的是SIGMOD Edgar F. Codd 创新奖(以计算机科学家Edgar F.Codd命名),该奖项授予 “对数据库系统和数据库的开发、理解或使用具有持久价值的创新和高度重要的贡献”。
译文:
阿里云在近期的 SIGMOD 会议上展示了一项重大研究成果:其新开发的集群管理系统 Eigen+ 在生产数据库环境中实现了 36% 的内存分配效率提升,并彻底消除了 OOM(内存溢出)错误。
这一系统解决了云服务提供商长期面临的核心难题:如何在避免灾难性 OOM 错误的前提下,最大化内存利用率以降低成本,同时保障关键应用的可用性和服务等级目标(SLO)。
根据研究论文《Eigen+: Memory Over-Subscription for Alibaba Cloud Databases》所述,Eigen+ 在设计上与 AWS、Microsoft Azure 和 Google Cloud 等主流云服务商采用的传统内存过度分配方法显著不同。这一系统已在阿里云的生产环境中全面部署。
研究表明,在在线 MySQL 集群中,Eigen+ 平均将内存分配比从 75.67% 提升至 111.88%,提升幅度达到 36.21%,且 完全符合 SLO,无任何 OOM 事件发生。
对企业 IT 领导者而言,这组数据意味着 在提高可靠性的同时还能实现显著的成本节省。内存分配效率提升 36%,代表着企业可以在相同硬件上运行更多数据库实例,并降低故障风险。
与主流云厂商不同的技术路径 Eigen+ 采用的是基于分类的内存管理方式,而 AWS、Azure 和 GCP 等云服务商主要依赖基于预测的内存管理策略。Everest Group 的实践总监 Kaustubh K 指出:“这种不同的技术路径使得 Eigen+ 在云数据库市场上具有更强的技术差异化,有可能影响未来其他超大规模云厂商的战略走向。”
据阿里巴巴研究人员介绍,Eigen+ 目前已部署在成千上万的数据库实例上,支持 MySQL 的 OLTP(联机事务处理) 和 AnalyticDB for PostgreSQL 的 OLAP(联机分析处理) 工作负载。
内存过度分配的风险 所谓内存过度分配(Memory Over-Subscription),是指分配给虚拟机的内存总量超过物理内存容量。因为大多数虚拟机不会同时使用全部分配内存,这种方式被云厂商广泛采纳,提升资源利用率。
然而,对运行关键数据库的企业来说,这是一场高风险的平衡游戏。研究人员在论文中指出:“虽然内存过度分配可以提高资源利用率、支持更多实例运行,但它也增加了 OOM 错误的风险,可能破坏服务可用性并导致违反 SLO。”
尤其是在数据库领域,风险尤为严重。“数据显示,随着 OOM 事件数量增加,服务可用性显著下降,甚至低于 SLO 阈值。”传统方法试图基于历史数据预测未来内存使用趋势,并利用复杂算法将实例打包部署在服务器上。但 一旦出现意外的负载波动,这类预测方法可能出现灾难性失败。
Everest Group 的 Kaustubh 强调:“消除 OOM 错误对企业 IT 至关重要,它关系到服务中断和数据丢失的风险。企业在选择云服务商时,应该重点评估其实时监控能力、租户隔离机制,以及如实时迁移、内存气球技术等过载应对策略。同时,对过度分配策略的透明度和严格遵守 SLA,也是保障系统稳定和性能一致性的关键。”
用“二八法则”代替复杂预测 与其预测不可预测的内存使用模式,阿里云研究团队发现:数据库 OOM 错误遵循 “帕累托法则”(二八法则)。论文指出:“一周内内存使用变化超过 5% 的数据库实例,不超过所有实例的 5%,但却造成了超过 90% 的 OOM 错误。”
因此,Eigen+ 不再试图对所有实例做全面预测,而是将问题简化为分类任务,识别出“瞬态实例”(memory usage 波动剧烈的实例)并排除其内存过度分配资格。研究人员表示:“通过识别瞬态实例,我们将复杂的预测问题转化为更简单的二分类问题。”
AI 分类 + 多种策略估算 Eigen+ 使用机器学习分类器,根据运行时指标(内存使用率、QPS、CPU 使用率)以及元数据(实例规格、客户等级、应用类型)识别高风险实例。系统还引入 马尔可夫链状态转移模型 来捕捉数据库行为的时序特征,从而实现高准确率识别。
对于被认定为“稳定”的实例,Eigen+ 则根据使用模式采用不同的估算方法:包括分位数分析(percentile)、随机打包(stochastic bin packing)以及时间序列预测等。
可量化的 SLO 建模能力 对企业来说最关键的是:Eigen+ 提供了 可量化的 SLO 影响模型。通过 二次逻辑回归(quadratic logistic regression),系统可以精确计算出维持目标 SLO 所对应的机器级内存使用阈值。
论文中写道:“利用该回归模型,我们可解出达到目标服务可用率(Ptarget)所对应的内存利用率 X。”这让企业运维人员可以明确知道可接受的过度分配上限,而不再依赖经验或保守估计。
具备应急迁移机制 考虑到分类机制并非百分百准确,Eigen+ 还内建了 实时迁移(Live Migration) 的容错机制。当系统检测到内存使用逼近危险阈值时,会自动将实例迁移至负载更低的服务器。
在生产测试中,“最后两天内只触发了 5 次实时迁移(包括镜像数据库),这类操作对系统的影响微乎其微,验证了 Eigen+ 在保障性能稳定方面的有效性,同时也未影响用户体验。”
行业意义与竞争格局影响 这项研究表明,当前主流云厂商在内存过度分配方面采用的预测模型可能过于复杂,反而不如阿里云采用的简洁分类方法有效。论文指出,Google Autopilot、AWS Aurora 和 Microsoft Azure 等产品均采用预测驱动方法,在高负载场景下容易失效。
对于正在评估云数据库服务的企业 IT 团队而言,Eigen+ 代表了阿里云在数据库可靠性与资源效率方面的潜在竞争优势,特别是在那些对稳定性与成本敏感的市场中,其技术路径可能重塑未来云数据库服务的行业标准。

https://www.infoworld.com/article/4016705/alibaba-cloud-launches-eigen-to-cut-costs-and-boost-reliability-for-enterprise-databases.html
----
写到最后:Eigen 集群管理系统的在某云的使用,势必会让某云的成本直线下降,同时也给企业云企业以压力,成本的降低就说明更大效率的利用云上的资源,避免超卖后的系统问题,这会让某云的数据库运行的更加的稳定,且成本更低,对于用户是好消息,对于友商必然是“噩梦”。
----
写到这里:
DTCC 大会好多年没有去了,DTCC作为国内著名的数据库盛会,我还记得我年轻的时候DTCC大会的热闹景象,我记得那时看着盖国强盖老板,那是真年轻,妥妥的帅哥一枚,年轻的盖老板颜值妥妥现在话讲的“网红小鲜肉”。时间过得太快16年过去了转眼到了2025年,数据库行业的人换了一代又一代,内容也换了又换,今年DTCC 大会多了很多AI的内容,另外我建议以后可以增加云,云原生数据库的内容,终究,阿里云,腾讯云,华为云,这三大云厂商的数据库产品差不多已经占据整体中国数据库市场的半壁江山。
这里和ITPUB的岳老师有一些私人关系,如果有想要票的话,请加 微信号ITSupStar ,暗号是Austindatabases介绍来的,票的数量不多先到先得吧!
AustinDatabases 的 PolarDB非官方课程:
PolarDB 非官方课程第四节--PG实时物化视图与行列数据整合处理--答题领奖品
PolarDB 非官方课程第三节--MySQL+IMCI=性能怪兽--答题领奖品
PolarDB 非官方课程第二节--云原生架构与特有功能---答题领奖品
PolarDB 非官方课程第一节-- 用户角度怎么看PolarDB --答题领奖品
置顶
DBA 的《天空没有极限》--IF Club 宣传片拍摄全过程--谁是钢铁玫瑰!
HyBrid Search 实现价值落地,从真实企业的需求角度分析 !不只谈技术!
OceanBase 光速快递 OB Cloud “MySQL” 给我,Thanks a lot
从“小偷”开始,不会从“强盗”结束 -- IvorySQL 2025 PostgreSQL 生态大会
免费PolarDB云原生课程,听课“争”礼品,重塑云上知识,提高专业能力
被骂后的文字--技术人不脱离思维困局,终局是个 “死” ? ! ......
9个群2025上半年总结,OB、PolarDB, DBdoctor、爱可生、pigsty、osyun、工作岗位等
用MySQL 分区表脑子有水!从实例,业务,开发角度分析 PolarDB 使用不会像MySQL那么Low
云数据库产品应改造PostgreSQL逻辑复制槽缺陷--来自真实企业的需求
泉城济南IvorySQL 2025 “雷暴云” 就在云和云原生会场
SQL SERVER 2025发布了, China幸亏有信创!
MongoDB 麻烦专业点,不懂可以问,别这么用行吗 ! --TTL
PostgreSQL 新版本就一定好--由培训现象让我做的实验
删除数据“八扇屏” 之 锦门英豪 --我去-BigData!
写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》
疯狂老DBA 和 年轻“网红” 程序员 --火星撞地球-- 谁也不是怂货
和架构师沟通那种“一坨”的系统,推荐只能是OceanBase,Why ?
OceanBase 相关文章
写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》
OceanBase 6大学习法--OBCA视频学习总结第六章
OceanBase 6大学习法--OBCA视频学习总结第五章--索引与表设计
OceanBase 6大学习法--OBCA视频学习总结第五章--开发与库表设计
OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装
OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎
OceanBase 架构学习--OB上手视频学习总结第二章 (OBCA)
OceanBase 6大学习法--OB上手视频学习总结第一章
没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛
跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)
跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)
跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)
跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)
OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB
MongoDB 相关文章
MongoDB “升级项目” 大型连续剧(4)-- 与开发和架构沟通与扫尾
MongoDB “升级项目” 大型连续剧(3)-- 自动校对代码与注意事项
MongoDB “升级项目” 大型连续剧(2)-- 到底谁是"der"
MongoDB “升级项目” 大型连续剧(1)-- 可“生”可不升
MongoDB 大俗大雅,上来问分片真三俗 -- 4 分什么分
MongoDB 大俗大雅,高端知识讲“庸俗” --3 奇葩数据更新方法
MongoDB 大俗大雅,高端的知识讲“通俗” -- 2 嵌套和引用
MongoDB 大俗大雅,高端的知识讲“低俗” -- 1 什么叫多模
MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通
MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)
MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模
MongoDB 双机热备那篇文章是 “毒”
MongoDB 会丢数据吗?在次补刀MongoDB 双机热备
MONGODB ---- Austindatabases 历年文章合集
PolarDB 相关文章
用MySQL 分区表脑子有水!从实例,业务,开发角度分析 PolarDB 使用不会像MySQL那么Low
MySQL 和 PostgreSQL 可以一起快速发展,提供更多的功能?
“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!
POLARDB 添加字段 “卡” 住---这锅Polar不背
PolarDB 版本差异分析--外人不知道的秘密(谁是绵羊,谁是怪兽)
PolarDB 答题拿-- 飞刀总的书、同款卫衣、T恤,来自杭州的Package(活动结束了)
PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火
PostgreSQL 相关文章
PostgreSQL Hybrid能力岂非“小趴菜”数据库可比 ?
PostgreSQL 新版本就一定好--由培训现象让我做的实验
PostgreSQL 无服务 Neon and Aurora 新技术下的新经济模式 (翻译)
“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!
PostgreSQL 添加索引导致崩溃,参数调整需谨慎--文档未必完全覆盖场景
PostgreSQL SQL优化用兵法,优化后提高 140倍速度
PostgreSQL 运维的难与“难” --上海PG大会主题记录
PostgreSQL 什么都能存,什么都能塞 --- 你能成熟一点吗?
全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始
PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁
PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!
病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)
PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜
PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆
PostgreSQL 分组查询可以不进行全表扫描吗?速度提高上千倍?
POSTGRESQL --Austindatabaes 历年文章整理
PostgreSQL 查询语句开发写不好是必然,不是PG的锅
PostgreSQL 字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"
PostgreSQL Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)
PostgreSQL 玩PG我们是认真的,vacuum 稳定性平台我们有了
PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)
MySQL相关文章
MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验
用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊
MYSQL --Austindatabases 历年文章合集
临时工访谈系列
没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛
SQL SERVER 系列
SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗