任何事务机制在实现时,都应该考虑事务的ACID特性,包括:本地事务、分布式事务。
本地事务
大多数场景下,应用都只需要操作单一的数据库,这种情况下的事务称之为本地事务。本地事务的ACID特性是数据库直接提供支持。在JDBC编程中,通过java.sql.Connection对象来开启、关闭或者提交事务。代码如下所示:
Connection conn = ... //获取数据库连接
conn.setAutoCommit(false); //开启事务
try{
//...执行增删改查sql
conn.commit(); //提交事务
}catch (Exception e) {
conn.rollback();//事务回滚
}finally{
conn.close();//关闭链接
}
此外,很多java应用都整合了Spring,并使用其声明式事务管理功能来完成事务功能。一般使用的步骤如下:
- 配置事务管理器。Spring提供了一个
PlatformTransactionManager接口,其有2个重要的实现类:DataSourceTransactionManager:用于支持本地事务,事实上,其内部也是通过操作java.sql.Connection来开启、提交和回滚事务。JtaTransactionManager:用于支持分布式事务,其实现了JTA规范,使用XA协议进行两阶段提交 - 在需要开启的事务的bean的方法上添加
@Transitional注解
分布式事务典型场景
完成某一个业务功能需要横跨多个服务,操作多个数据库,这就涉及到了分布式事务,应用需要保证对于多个资源服务器的数据的操作,要么全部成功,要么全部失败。本质上来说,分布式事务就是为了保证不同资源服务器的数据一致性。典型的分布式事务场景:
- 跨库事务:跨库事务指的是,一个应用某个功能需要操作多个库,不同的库中存储不同的业务数据
- 分库分表:通常一个库数据量比较大或者预期未来的数据量比较大,都会进行水平拆分,也就是分库分表
- 服务化(SOA):某个应用同时操作了多个库,这样的应用业务逻辑非常复杂,应该拆分成不同的独立服务,以简化业务逻辑。拆分后,独立服务之间通过RPC框架来进行远程调用,实现彼此的通信
分布式事务处理(Distributed Transaction Processing,DTP)的5个基本元素:
- 应用程序(Application Program ,AP):用于定义事务边界(即定义事务的开始和结束),并且在事务边界内对资源进行操作
- 资源管理器(Resource Manager,RM):如数据库、文件系统等,并提供访问资源的方式
- 事务管理器(Transaction Manager ,TM):负责分配事务唯一标识,监控事务的执行进度,并负责事务的提交、回滚等
- 通信资源管理器(Communication Resource Manager,CRM):控制一个TM域(TM domain)内或者跨TM域的分布式应用之间的通信
- 通信协议(Communication Protocol,CP):提供CRM提供的分布式应用节点之间的底层通信服务
两阶段提交协议(2PC)
两阶段提交协议将提交过程划分为2个阶段:
阶段1:
TM通知各个RM准备提交它们的事务分支。如果RM判断自己进行的工作可以被提交,那就对工作内容进行持久化,再给TM肯定答复;要是发生了其他情况,那给TM的都是否定答复。在发送了否定答复并回滚了已经的工作后,RM就可以丢弃这个事务分支信息。
以MySQL数据库为例,在第一阶段,事务管理器向所有涉及到的数据库服务器发出prepare"准备提交"请求,数据库收到请求后执行数据修改和日志记录等处理,处理完成后只是把事务的状态改成"可以提交",然后把结果返回给事务管理器。
阶段2
TM根据阶段1各个RM prepare的结果,决定是提交还是回滚事务。如果所有的RM都prepare成功,那么TM通知所有的RM进行提交;如果有RM prepare失败的话,则TM通知所有RM回滚自己的事务分支。
以MySQL数据库为例,如果第一阶段中所有数据库都prepare成功,那么事务管理器向数据库服务器发出"确认提交"请求,数据库服务器把事务的"可以提交"状态改为"提交完成"状态,然后返回应答。如果在第一阶段内有任何一个数据库的操作发生了错误,或者事务管理器收不到某个数据库的回应,则认为事务失败,回撤所有数据库的事务。数据库服务器收不到第二阶段的确认提交请求,也会把"可以提交"的事务回撤。
两阶段提交协议(2PC)存在的问题
1、同步阻塞问题
一个全局事务内部包含了多个独立的事务分支,这一组事务分支要不都成功,要不都失败。各个事务分支的ACID特性共同构成了全局事务的ACID特性,即将单个事务分支的支持的ACID特性提升一个层次到分布式事务的范畴。
即使在本地事务,如果对操作读很敏感,也需要将事务隔离级别设置为SERIALIZABLE。而对于分布式事务来说,更是如此,可重复读隔离级别不足以保证分布式事务一致性。即如果使用MySQL来支持XA分布式事务的话,那么需要将事务隔离级别设置为SERIALIZABLE,而其执行效率是最低的一个级别。
2、单点故障
由于协调者的重要性,一旦协调者TM发生故障。参与者RM会一直阻塞下去。尤其在第二阶段,协调者发生故障,那么所有的参与者还都处于锁定事务资源的状态中,而无法继续完成事务操作。
3、数据不一致
在二阶段提交的阶段二中,当协调者向参与者发送commit请求之后,发生了局部网络异常或者在发送commit请求过程中协调者发生了故障,会导致只有一部分参与者接受到了commit请求。而在这部分参与者接到commit请求之后就会执行commit操作,但是其他部分未接到commit请求的机器则无法执行事务提交。于是整个分布式系统便出现了数据不一致性的现象。
三阶段提交协议(Three-phase commit)
由于二阶段提交存在着诸如同步阻塞、单点问题等缺陷,所以提出了三阶段提交。与两阶段提交不同的是,三阶段提交有两个改动点:
- 引入超时机制。同时在协调者和参与者中都引入超时机制
- 在第一阶段和第二阶段中插入一个准备阶段。保证了在最后提交阶段之前各参与节点的状态是一致的。即除了引入超时机制之外,3PC把2PC的准备阶段再次一分为二,这样三阶段提交就有CanCommit、PreCommit、DoCommit三个阶段

CanCommit阶段
协调者向参与者发送commit请求,参与者如果可以提交就返回Yes响应,否则返回No响应
PreCommit阶段
协调者根据参与者的反应情况来决定是否可以进行事务的PreCommit操作。根据响应情况,有以下两种可能:
假如协调者从所有的参与者获得的反馈都是Yes响应,那么就会执行事务的预执行。
1.发送预提交请求:协调者向参与者发送PreCommit请求,并进入Prepared阶段。
2.事务预提交:参与者接收到PreCommit请求后,会执行事务操作,并将undo和redo信息记录到事务日志中。
3.响应反馈:如果参与者成功的执行了事务操作,则返回ACK响应,同时开始等待最终指令。
假如有任何一个参与者向协调者发送了No响应,或者等待超时之后,协调者都没有接到参与者的响应,那么就执行事务的中断。
1.发送中断请求:协调者向所有参与者发送abort请求。
2.中断事务:参与者收到来自协调者的abort请求之后,执行事务的中断。
doCommit阶段
该阶段进行真正的事务提交,分为两种情况:
Case 1:执行提交
1.发送提交请求 协调接收到参与者发送的ACK响应,那么他将从预提交状态进入到提交状态。并向所有参与者发送doCommit请求。
2.事务提交 参与者接收到doCommit请求之后,执行正式的事务提交。并在完成事务提交之后释放所有事务资源。
3.响应反馈 事务提交完之后,向协调者发送Ack响应。
4.完成事务 协调者接收到所有参与者的ack响应之后,完成事务。
Case 2:中断事务
协调者没有接收到参与者发送的ACK响应,那么就会执行中断事务。
1.发送中断请求 协调者向所有参与者发送abort请求
2.事务回滚 参与者接收到abort请求之后,利用其在阶段二记录的undo信息来执行事务的回滚操作,并在完成回滚之后释放所有的事务资源。
3.反馈结果 参与者完成事务回滚之后,向协调者发送ACK消息
4.中断事务 协调者接收到参与者反馈的ACK消息之后,执行事务的中断。
在doCommit阶段,如果参与者无法及时接收到来自协调者的doCommit或者rebort请求时,会在等待超时之后,会继续进行事务的提交。
相对于2PC,3PC主要解决的单点故障问题,并减少阻塞,因为一旦参与者无法及时收到来自协调者的信息之后,他会默认执行commit。而不会一直持有事务资源并处于阻塞状态。但是这种机制也会导致数据一致性问题,因为,由于网络原因,协调者发送的abort响应没有及时被参与者接收到,那么参与者在等待超时之后执行了commit操作。这样就和其他接到abort命令并执行回滚的参与者之间存在数据不一致的情况。
本文深入解析事务的ACID特性,探讨本地事务与分布式事务的区别,详述两阶段提交(2PC)与三阶段提交(3PC)协议,揭示分布式事务处理的挑战与解决方案。
654

被折叠的 条评论
为什么被折叠?



