分布式事务

庄隐

于 2024-03-24 15:20:25 发布

阅读量1k

点赞数 20

分类专栏： Java 文章标签：分布式

本文链接：https://blog.youkuaiyun.com/Luck_gun/article/details/136988292

版权

Java 专栏收录该内容

73 篇文章

订阅专栏

本文探讨了分布式事务在现代企业级应用中的重要性，介绍了2PC、3PC、TCC和Saga等处理方式，详细阐述了它们的工作原理、面临的挑战以及各自的优缺点，为分布式环境下的数据一致性管理提供了深度见解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在现代企业级应用架构中，随着微服务化和云计算技术的广泛应用，分布式系统已成为常态。而在这样的环境下，保证数据的一致性和完整性显得尤为重要，这就引出了分布式事务的概念。本文将深入探讨分布式事务的基本原理、面临的主要挑战以及当前主流的解决方案。

一、分布式事务简介

分布式事务是指涉及跨越多个数据库或服务的事务，这些数据库或服务可能运行在不同的服务器上，彼此之间通过网络通信。在分布式事务中，需要确保“ACID”特性——原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持久性（Durability）在所有资源上都能得到满足。

二、分布式事务的挑战

数据一致性：在分布式环境中，各个节点间的数据同步存在延迟，如何保证全局的一致性是一个主要挑战。
网络通信问题：节点间的网络通信可能出现失败或者延迟，导致事务参与者无法及时收到对方的消息，影响事务的正确执行。
协调复杂性：分布式事务需要一种机制来协调各个子事务的提交或回滚，而这往往涉及到复杂的协议和算法。
性能与可用性：严格的事务一致性可能会严重影响系统的性能和可用性，尤其是在大规模分布式系统中。

三、分布式事务解决方案

1. 两阶段提交（2PC，Two-Phase Commit）：

两阶段提交（2PC, Two-Phase Commit）是分布式事务处理中的一种协议，主要用于解决分布式环境下多个参与节点如何就事务的提交或回滚达成一致的问题。该协议主要包括两个阶段：准备阶段（Prepare Phase）和提交阶段（Commit Phase）。

第一阶段（准备阶段）

协调者（Coordinator） 发起一个事务请求给所有的参与者（Participant）。
每个参与者根据自身状态检查事务是否可以提交，如果可以则锁定相关资源并记录事务日志，进入“准备好”状态，然后向协调者反馈一个预备投票结果（Yes或No）。
如果所有参与者都回复“可以提交”，则继续第二阶段；如果有任何一个参与者回复“不可以提交”，则直接进入回滚流程。

第二阶段（提交阶段）

提交阶段 只有在所有参与者在第一阶段都表示“可以提交”时才会发生。此时，协调者向所有参与者发送“正式提交”命令。
收到提交命令后，参与者正式提交事务，并释放之前锁定的资源，更新数据库状态，同时向协调者发送事务已提交的确认信息。
协调者收集到所有参与者的提交确认信息后，确定整个分布式事务完成提交。

风险与局限性

尽管两阶段提交协议在理论上能够保证分布式事务的原子性，但在实际应用中存在一些显著的风险和局限性：

单点故障：协调者成为整个事务流程中的单点故障源，一旦协调者在任一阶段发生故障，可能导致参与者长时间锁定资源而无法释放。
阻塞等待：在等待所有参与者响应或在第二阶段等待提交确认的过程中，参与者可能需要保持资源锁定状态，降低了系统的并发性能，并可能导致活锁或死锁问题。
数据不一致：若在第二阶段提交过程中出现网络分区或其他异常情况，可能会导致部分参与者已经提交事务，而其他参与者未能提交，从而产生数据不一致性。

2. 三阶段提交（3PC，Three-Phase Commit）：

三阶段提交（3PC, Three-Phase Commit）是在两阶段提交协议（2PC）基础上改进的一种分布式事务处理协议，旨在解决2PC协议中的一些不足，尤其是面对网络延迟和协调者单点故障的问题。3PC将事务提交的过程细分为三个阶段：CanCommit、PreCommit 和 DoCommit。

第一阶段（CanCommit）

协调者（Coordinator） 向所有参与者（Participant）询问是否可以执行提交操作。
参与者根据自身状态判断是否可以进行事务提交，返回“是”或“否”的响应给协调者。
如果协调者收到任何参与者返回的“否”响应，那么立即通知所有参与者abort事务（进入第三阶段），否则进入第二阶段。

第二阶段（PreCommit）

协调者根据第一阶段所有参与者的反馈决定是否继续事务。如果所有参与者都回复可以提交，则协调者会发送预提交消息（PreCommit）给所有参与者。
参与者接收到预提交消息后，会进一步锁定事务涉及的相关资源，并做好提交事务的准备工作，但不立即提交事务。同时，参与者会进入超时等待阶段，等待协调者的最后指令。
若协调者在此期间未收到任何参与者无法提交事务的通知，则进入第三阶段。相反，若有任何问题导致协调者决定中止事务，它将发送abort命令给所有参与者。

第三阶段（DoCommit）

提交阶段：协调者根据第二阶段的结果，向所有参与者发送“正式提交”（DoCommit）或“中止事务”（Abort）的消息。
如果收到的是“正式提交”命令，参与者将正式提交事务并释放锁定资源，然后向协调者发送确认消息。
若收到的是“中止事务”命令，参与者则回滚事务并解锁资源。

优点与改进之处

相比两阶段提交，三阶段提交主要改进在于：

减少单点故障的影响：在第二阶段，参与者已经对资源进行了锁定，即使协调者在发出DoCommit命令前发生故障，大多数情况下，参与者可以通过超时机制自行决定提交或回滚事务，从而降低系统阻塞的可能性。
减少阻塞时间：通过引入预提交阶段，参与者可以在正式提交前提前锁定资源，缩短了在不确定状态下持有资源的时间。

局限性

尽管三阶段提交协议相对于两阶段提交有所改善，但仍存在以下局限性：

网络分区问题：在网络分区情况下，部分参与者可能无法收到协调者的指令，导致数据不一致。
超时设置较难把握：超时时间设置过短可能因网络波动造成不必要的事务回滚，过长则可能导致资源长期锁定。

3. TCC（Try-Confirm-Cancel）模式：

TCC（Try-Confirm-Cancel）模式是一种应用于分布式事务处理的补偿型事务解决方案，由支付宝首席架构师程立提出。TCC模式全称为“Try-Confirm-Cancel”，即将一个分布式事务拆分成三个阶段：尝试（Try）、确认（Confirm）和取消（Cancel）。

一、Try阶段

尝试阶段：首先发起一个业务操作的尝试操作，这个阶段主要是对业务资源做检测和预留，比如扣减库存、冻结资金等，但不实际修改业务状态。在这个阶段，各服务需要预先确定本次事务是否可以执行，如果不能执行，则直接返回失败，无需进入后续阶段。

二、Confirm阶段

确认阶段：当所有参与事务的服务在Try阶段都成功执行后，开始进入Confirm阶段。这个阶段实际上是真正执行业务逻辑，确认并提交前一步骤中预留的操作，使得业务状态发生实质性变更。只有所有参与的服务在Confirm阶段都成功，整个事务才认为成功完成。

三、Cancel阶段

取消阶段：如果在Confirm阶段中，任何一个服务执行失败，那么就需要触发Cancel阶段，撤销之前在Try阶段所做的预留操作，以确保业务状态回到事务开始前的一致状态。这样做的目的是保证事务的原子性和一致性。

TCC模式优势与挑战

优势：
- 解决了分布式环境下的事务一致性问题，尤其适用于微服务架构下的分布式事务处理。
- 提供了一种灵活的设计思路，允许开发者根据业务场景自定义Try、Confirm、Cancel的具体逻辑，增强了事务处理的适应性和扩展性。
挑战：
- 实现复杂度相对较高，需要针对每个业务操作分别编写Try、Confirm、Cancel三个阶段的处理逻辑。
- 对于资源的锁定和释放需要精心设计，避免在Cancel阶段出现问题导致资源无法正确回滚。
- 在极端情况下，Cancel阶段可能存在一定概率的补偿失败，需要设计重试策略以及人工干预机制。

应用场景

TCC模式广泛应用于电商、金融、支付等场景下的分布式事务处理，例如在订单创建、支付交易、机票预订等业务中，通过对资源进行先尝试锁定再确认提交或取消释放的方式，确保在分布式环境下事务的最终一致性。

Saga事务

Saga事务是一种在分布式事务管理中使用的模式，最初由Hector Garcia-Molina等人在1987年的论文《Sagas》中提出，它是解决分布式系统中长事务（Long-lived transaction）问题的一种方法。Saga事务特别适用于那些跨越多个服务或数据库操作并且需要保持最终一致性的业务流程。

在Saga模式中，一个大事务被分解成一系列具有明确前后依赖关系的小型本地事务（或子事务）。每个子事务都是一个完整的ACID事务，可以独立提交。此外，每个子事务还关联有一个补偿操作（Compensation action），这个补偿操作用于撤销前面已完成子事务的效果，以在遇到错误或异常时恢复到一个一致的状态。

Saga事务执行的过程如下：

正常执行路径：
- 应用程序启动一个Saga事务。
- Saga按照预定的顺序依次执行各个子事务。
- 每个子事务在执行完成后都会被提交，并且记录下自己的状态和相关的补偿操作。
补偿执行路径：
- 如果在执行过程中某个子事务失败，Saga会触发补偿逻辑，即执行前面已完成子事务的对应补偿操作。
- 补偿操作按照逆序执行，直到所有已执行过的子事务的影响都被消除，使得整个Saga事务如同从未发生过一样。

Saga事务的优点包括：