❝开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,可以解决你的问题。加群请联系 liuaustin3 ,(共3300人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 +9)(1 2 3 4 5 6 7群均已爆满,开8群近400 9群 200+,开10群PolarDB专业学习群100+)
HTAP到底有没有需求,这个问题大部分情况之前的我的想法是,还好吧,不是强需求。最近业务一次深入,直接打脸。 HTAP是强需求,且开发和架构大部分对于数据库陌生的还认为数据库无法做到这点,因为认知的缺失,导致数据,业务,开发,大数据等部门在这里“撞天婚”。
当前Saas行业已经内卷到报表的部分已经答应客户要进行即席查询,也就是数据写进去了,客户就要查出来。整体的业务架构因为这些许诺,做了很多的努力,但在做努力,缺陷是存在的,最近就遇到了这样的问题。
1 修改表的字段结构,导致数据传输量骤增的场景,让数据链路瞬间增加流量导致数据无法进行实时大数据的计算的问题。
在业务的迭代中,我们会遇到字段的扩展,这里无论是MySQL,PostgreSQL都会遇到修改字段类型导致的表重建的问题。比如你的表的字段从decimal(2,2) 修改成decmial(7,2)的情况下,表是要重建的,如果是一堆的表,一些大表已经到了30多G一张的情况,且一个实例中存在多个逻辑库,每个逻辑库都有这样的表,每张表都这么大,而业务要求一次性把这些表都要修改,那么问题就来了。
1 修改必然锁表,业务必然受到影响,客诉就没法避免了。
2 修改时,这些表都是同时触发,CPU IOPS 内存都在承受压力
通用的做法
就是分批来操作,新建表把要的表结构做好,然后通过数据同步的方式来进行数据重新灌入,在预定的时间来切换表,将老表下线,新表上线的处理方式,这和gh-ost,pt-osc 的方式类似,但实际上这样的新的方式更自由,切换的时间更灵活。
但是这产生了另一个问题,一个数据库实例会新增N个修改字段的临时表,且这些表都是大表,在这样的情况下,无论是 PG 还是 MYSQL 都会瞬间多出很多的日志涌向大数据的数据复制通道,在这样的情况下,数据延迟,大数据数据处理延迟等问题就出来了。
因为我们在做表字段的修改的情况下,都会遇到类似的问题,这里就会产生一个HTAP的需求,如果我们把数据传输的中间环节去掉,且数据就在源库上进行大数据处理,那么修改字段通过临时表的方案就不会影响到大数据的处理。
但为什么很多架构师对于这个在源库进行数据分析的想法都持否定观点。我们可以继续追根溯源。因为传统数据库的“无能”。
很多架构师在设计系统时,都会把 “分析” 和 “交易” 分开,形成一条标准的数据链路:业务库 → 数据同步 → 大数据处理平台 → 报表查询。 在纸面上,这个模型看起来优雅又高可用,但现实是——链路长、环节多、数据一致性弱、延迟不可控。但是环节越长,产生的问题点就会越多。以数据库为例
表结构改动触发表重建
产生巨量写入和日志
日志一股脑挤爆数据同步通道
大数据那边全线延迟
客户那端只看到——“怎么刷新不出来了?”
然后就是投诉,投诉,投诉!!!
如果数据库本身可以进行HTAP中的数据分析,那么就可以达到
去掉复制延迟的中间环节数据落盘即查询,不用等数据复制到大数据平台后再跑 ETL。
架构简化少了一套同步服务,少了日志堆积点,少了中间层调度的锅。
灵活应对业务,突发表结构变更时,临时表的写入压力不会挤爆同步链路,因为分析和交易读取同源。
缩短问题排查链路,除了延迟问题,直接在源库查就知道是写入瓶颈还是计算瓶颈,不用在三套系统之间甩锅。
同时还存在另一个疑问主要是系统的资源的隔离,在运行OLTP的数据库上运行OLAP的分析,会大量消耗系统的资源,OLAP的资源消耗又要引起OLTP的资源不足,营销业务,所以这两个部分的资源隔离也是一个实现在一个数据库上进行TP AP的关键。
那为什么之前没有发现有强HTAP的需求,只能说一叶障目没有深入到业务当中,体会业务的真实需求。
但HTAP也要解决一些棘手的问题,比如资源隔离,多种索引的建立应对不同的需求,数据节点的临时扩展和收缩,满足HTAP的一些临时性能需求,与成本的最小化的要求。
这篇文章是是临时所想,先把问题记录下来,后续就是寻找解决方案,逐步满足业务需求,将数据库往HTAP的道路上引导,最后HTAP是不是潮流我不知道,但这一定是新型数据库的趋势,我要的价值是真正的价值不在于“技术多先进”,而在于它帮你少掉几个容易出事的环节,让你在凌晨三点的客户投诉电话里,能平静地说:“你现在查一下,数据已经在了。”
在写完这篇文章后,后续又遇到一些问题,在这里我更坚定的认为,对于中小企业HTAP完全是一个必需品,数据链路过长,导致个各种问题,小道限制你修改一个字段的类型,修改字段类型导致重建表,而重建大表会导致大数据消费的拥塞,最终影响业务,所以如果我们有一个HTAP的强力数据库产品,减少数据链路的长度,那么一连串的问题也就不存在了。
置顶
MongoDB 开始接客户应用系统 AI 改造的活了--OMG 这世界太疯狂
一篇将PostgreSQL 日志问题说的非常详细附带分析解决方案的文章 (翻译)
企业DBA 应该没听说过 Supabase,因为他不单纯 !!
Oracle 推出原生支持 Oracle 数据库的 MCP 服务器,助力企业构建智能代理应用
PolarDB MySQL SQL 优化指南 (SQL优化系列 5)
开发欺负我 Redis 的大 keys的问题,我一个DBA怎么解决?
IF-Club 你提意见拿礼物 AustinDatabases 破 10000
开发欺负我 Redis 的大 keys的问题,我一个DBA怎么解决?
OceanBase 相关文章
OceanBase 光速快递 OB Cloud “MySQL” 给我,Thanks a lot
和架构师沟通那种“一坨”的系统,推荐只能是OceanBase,Why ?
OceanBase Hybrid search 能力测试,平换MySQL的好选择
写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》
OceanBase 6大学习法--OBCA视频学习总结第六章
OceanBase 6大学习法--OBCA视频学习总结第五章--索引与表设计
OceanBase 6大学习法--OBCA视频学习总结第五章--开发与库表设计
OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装
OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎
OceanBase 架构学习--OB上手视频学习总结第二章 (OBCA)
OceanBase 6大学习法--OB上手视频学习总结第一章
没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛
跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)
跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)
跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)
跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)
OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB
“合体吧兄弟们!”——从浪浪山小妖怪看OceanBase国产芯片优化《OceanBase “重如尘埃”之歌》
MongoDB 相关文章
MongoDB “升级项目” 大型连续剧(4)-- 与开发和架构沟通与扫尾
MongoDB “升级项目” 大型连续剧(3)-- 自动校对代码与注意事项
MongoDB “升级项目” 大型连续剧(2)-- 到底谁是"der"
MongoDB “升级项目” 大型连续剧(1)-- 可“生”可不升
MongoDB 大俗大雅,上来问分片真三俗 -- 4 分什么分
MongoDB 大俗大雅,高端知识讲“庸俗” --3 奇葩数据更新方法
MongoDB 大俗大雅,高端的知识讲“通俗” -- 2 嵌套和引用
MongoDB 大俗大雅,高端的知识讲“低俗” -- 1 什么叫多模
MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通
MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)
MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模
MongoDB 双机热备那篇文章是 “毒”
MongoDB 会丢数据吗?在次补刀MongoDB 双机热备
MONGODB ---- Austindatabases 历年文章合集
MongoDB 麻烦专业点,不懂可以问,别这么用行吗 ! --TTL
PolarDB 已经开放的课程
PolarDB 非官方课程第八节--数据库弹性弹出一片未来--结课
PolarDB 非官方课程第七节--数据备份还原瞬间完成是怎么做到的--答题领奖品
PolarDB 非官方课程第六节--数据库归档还能这么玩--答题领奖品
PolarDB 非官方课程第五节--PolarDB代理很重要吗?--答题领奖品
PolarDB 非官方课程第四节--PG实时物化视图与行列数据整合处理--答题领奖品
PolarDB 非官方课程第三节--MySQL+IMCI=性能怪兽--答题领奖品
PolarDB 非官方课程第二节--云原生架构与特有功能---答题领奖品
PolarDB 非官方课程第一节-- 用户角度怎么看PolarDB --答题领奖品
免费PolarDB云原生课程,听课“争”礼品,重塑云上知识,提高专业能力
PolarDB 相关文章
非“厂商广告”的PolarDB课程:用户共创的新式学习范本--7位同学获奖PolarDB学习之星
“当复杂的SQL不再需要特别的优化”,邪修研究PolarDB for PG 列式索引加速复杂SQL运行
数据压缩60%让“PostgreSQL” SQL运行更快,这不科学呀?
这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!
用MySQL 分区表脑子有水!从实例,业务,开发角度分析 PolarDB 使用不会像MySQL那么Low
MySQL 和 PostgreSQL 可以一起快速发展,提供更多的功能?
“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!
POLARDB 添加字段 “卡” 住---这锅Polar不背
PolarDB 版本差异分析--外人不知道的秘密(谁是绵羊,谁是怪兽)
PolarDB 答题拿-- 飞刀总的书、同款卫衣、T恤,来自杭州的Package(活动结束了)
PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火
PostgreSQL 相关文章
PostgreSQL 新版本就一定好--由培训现象让我做的实验
说我PG Freezing Boom 讲的一般的那个同学,专帖给你,看看这次可满意
邦邦硬的PostgreSQL技术干货来了,怎么动态扩展PG内存 !
3种方式 PG大版本升级 接锅,背锅,不甩锅 以客户为中心做产品
"PostgreSQL" 不重启机器就能调整 shared buffer pool 的原理
说我PG Freezing Boom 讲的一般的那个同学专帖给你看这次可满意
PostgreSQL Hybrid能力岂非“小趴菜”数据库可比 ?
PostgreSQL 新版本就一定好--由培训现象让我做的实验
PostgreSQL 无服务 Neon and Aurora 新技术下的新经济模式 (翻译)
“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!
PostgreSQL 添加索引导致崩溃,参数调整需谨慎--文档未必完全覆盖场景
PostgreSQL SQL优化用兵法,优化后提高 140倍速度
PostgreSQL 运维的难与“难” --上海PG大会主题记录
PostgreSQL 什么都能存,什么都能塞 --- 你能成熟一点吗?
全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始
PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁
PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!
病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)
PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜
PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆
PostgreSQL 分组查询可以不进行全表扫描吗?速度提高上千倍?
POSTGRESQL --Austindatabaes 历年文章整理
PostgreSQL 查询语句开发写不好是必然,不是PG的锅
PostgreSQL 字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"
PostgreSQL Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)
PostgreSQL 玩PG我们是认真的,vacuum 稳定性平台我们有了
PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)
这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!
MySQL相关文章
那个MySQL大事务比你稳定,主从延迟低,为什么? Look my eyes! 因为宋利兵宋老师
MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验
用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊
MYSQL --Austindatabases 历年文章合集
超强外挂让MySQL再次兴盛,国内神秘组织拯救MySQL行动
临时工访谈系列
没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛
SQL SERVER 系列
沧海要,《SQL SERVER 运维之道》,清风笑,竟惹寂寥
SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗
未知黑客通过SQL SERVER 窃取企业SAP核心数据,影响企业运营
数据库优化系列
MongoDB 查询 优化指南 四句真言 (查询 优化系列 4)
MySQL SQL 优化指南 SQL 四句真言(优化系列 3)
SQL SERVER SQL 优化指南 四句真言 (SQL 优化系列 2)
PostgreSQL SQL 优化指南 四句真言(SQL 优化系列 1)
杂谈
从 Universal 环球影城 到 国产数据库产品 营销 --驴唇对马嘴
微软动手了,联合OpenAI + Azure 云争夺AI服务市场
HyBrid Search 实现价值落地,从真实企业的需求角度分析 !不只谈技术!
从“小偷”开始,不会从“强盗”结束 -- IvorySQL 2025 PostgreSQL 生态大会
被骂后的文字--技术人不脱离思维困局,终局是个 “死” ? ! ......
个群2025上半年总结,OB、PolarDB, DBdoctor、爱可生、pigsty、osyun、工作岗位等
从MySQL不行了,到乙方DBA 给狗,狗都不干? 我干呀!
SQL SERVER 2025发布了, China幸亏有信创!
删除数据“八扇屏” 之 锦门英豪 --我去-BigData!
写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》
疯狂老DBA 和 年轻“网红” 程序员 --火星撞地球-- 谁也不是怂货

307

被折叠的 条评论
为什么被折叠?



