分布式事务：从入门到放弃再到真香的完整心路历程

最新推荐文章于 2025-11-26 02:47:41 发布

原创最新推荐文章于 2025-11-26 02:47:41 发布 · 854 阅读

·

22

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#分布式 #其他

文章目录

一、当单体遇上分布式：事务的美丽与哀愁

在单体应用时代（那会儿还没这么多幺蛾子），数据库事务就像老母亲的唠叨——虽然烦但靠谱。一个@Transactional注解就能搞定ACID四大护法（原子性、一致性、隔离性、持久性），程序员们的小日子过得不要太滋润。

直到有一天（命运的转折点来了）！微服务架构带着它的分布式诱惑翩然而至。当我们把订单服务和库存服务拆成两个独立应用后，突然发现：原本简单的下单减库存操作，现在居然成了跨世纪的难题！

举个栗子🌰（注意不是真栗子）：

用户下单成功（订单库commit）
调用库存服务扣减库存（库存库commit）
但！如果第二步网络抽风了…

这时候就会出现：用户以为自己买到了商品，实际上库存根本没减少（大型社会性死亡现场）。这就是分布式事务中的数据不一致问题，堪称程序员职业生涯的鬼见愁。

二、分布式事务的四大护法（这次是真的）

方案1：二阶段提交（2PC）—— 分布式届的老干部

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传（假装这里有图）

核心思想：搞个事务协调者当大家长，分准备和提交两个阶段。

阶段一（Prepare）：

// 所有参与者锁住资源
orderService.prepare();
inventoryService.prepare();

阶段二（Commit/Rollback）：

if(所有节点都OK){
    coordinator.commit(); // 全体起立鼓掌
}else{
    coordinator.rollback(); // 原地解散
}

血泪经验（来自深夜加班的老司机）：

MySQL的XA实现就是个磨人的小妖精
同步阻塞问题严重（等所有节点响应就像等女朋友化妆）
协调者单点故障要人命（所以记得双活部署！）

方案2：TCC模式 —— 互联网公司的宠儿

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传（继续假装有图）

Try-Confirm-Cancel三板斧：

Try阶段：资源预留

UPDATE inventory SET frozen = 10 WHERE product_id = 1001;

Confirm阶段：实际扣减

UPDATE inventory SET stock = stock - 10, frozen = 0 WHERE product_id = 1001;

Cancel阶段：回滚预留

UPDATE inventory SET frozen = 0 WHERE product_id = 1001;

填坑指南（别问我怎么知道的）：

一定要实现幂等性（不然重复请求会让你怀疑人生）
空回滚问题要处理（Try没执行却收到Cancel）
做好异常状态监控（建议接入ELK实时报警）

方案3：可靠消息最终一致性 —— 消息队列的逆袭

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传（你懂的）

核心玩法：

订单服务操作本地事务时，往消息表插条记录
后台线程轮询消息表，把消息扔到MQ
库存服务消费消息并执行业务
消费成功删除消息，失败就重试

避雷手册：

消息去重是必修课（建议用messageId+业务唯一键）
死信队列要配置合理（别让堆积的消息成为压垮骆驼的最后一根稻草）
本地事务和消息插入要原子性（不然等着数据不一致吧）

方案4：Saga模式 —— 长事务的救世主

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传（你继续想象）

分段提交+补偿机制：

// 正向操作
orderService.createOrder();
paymentService.pay();

// 逆向补偿
paymentService.cancelPay();
orderService.cancelOrder();

生存法则：

补偿接口必须幂等（重要的事情说三遍）
建议采用状态机管理流程（不然状态流转能让你崩溃）
可视化跟踪是刚需（推荐接入SkyWalking）

三、方案选型九阴真经（吐血整理）

方案	适用场景	优点	缺点
2PC	强一致性金融场景	强一致性	性能差，实现复杂
TCC	高并发互联网业务	灵活可控	开发成本高
可靠消息	异步最终一致性场景	系统解耦	消息延迟
Saga	长流程业务	天然支持长事务	补偿机制实现复杂
本地消息表	中小型项目	实现简单	数据库压力大
Seata AT	希望快速接入	自动回滚	锁范围大

（表格建议保存到手机相册，关键时刻能救命）

四、实战中的骚操作（都是血泪教训）

案例1：电商大促的惊魂三秒

去年双十一，我们的订单服务在零点突然响应变慢。定位发现是TCC的Try阶段锁了太多库存，导致数据库连接池爆了。解决方案：引入库存分段锁+本地缓存预热，把库存拆分成10个bucket，瞬间QPS提升5倍！

案例2：红包系统的午夜凶铃

春节期间，红包系统出现资损告警。追查发现是Saga的补偿接口没有幂等处理，导致重复回滚。教训：所有补偿接口必须做三个校验——业务流水号、操作状态、版本号。

案例3：跨国业务的时差陷阱

全球购业务中，由于时区问题导致对账异常。终极方案：所有时间戳强制使用UTC时间，关键业务表增加GMT时区字段，对账服务增加时区转换逻辑。

五、未来已来：云原生时代的曙光

现在的Serverless架构给分布式事务带来了新思路，比如：

AWS Step Functions 的流程编排
Alibaba Cloud的GTS云服务
基于Service Mesh的分布式事务代理

（悄悄说）最近在玩Dapr的分布式事务API，发现用Actor模型处理补偿机制简直不要太优雅。不过还在实验阶段，等稳定了再和大家分享。

六、写给新人的终极忠告

不要试图寻找银弹（不存在的）
CAP定理是铁律（接受不完美）
监控比算法更重要（看不见的问题最可怕）
定期做故障演练（墨菲定律永远有效）
文档要及时更新（别让后人走你的弯路）

最后送大家一句真理：分布式事务的尽头，是产品经理同意修改需求。 如果遇到实在解决不了的问题，不妨买杯奶茶去找产品同学聊聊人生理想（手动狗头）~

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。