单个数据库内部的事务,我们称为本地事务,需要保证多个数据源的操作要么都做要么都不做的事务,我们称为分布式事务
分布式事务由事务发起者、资源管理器(参与者)、事务协调者组成,下面我们看看二阶段协议内容
第一阶段
分布式事务发起方向事务协调器发起分布式事务,协调器则向所有事务参与者发起准备请求,事务参与者接受到请求后执行本地事务,但是不提交。如果所有事务参与者都返回了准备OK到事务协调器
则事务协调器准备进入第二阶段。如果有一个参与者返回准备失败,则事务协调器向所有参与者发起事务回滚请求,事务参与者收到请求后回滚执行的本地事务,则分布式事务结束。
第二阶段
事务协调器向所有事务参与者发起提交事务的请求,事务参与者接受到请求后,执行本地事务的提交操作。如果事务协调器收到所有参与者提交OK则分布式事务结束。
如果协调器发现有些参与者返回事务提交失败,则执行具体的事务补偿策略。
总结
二阶段协议是个标准协议,协议只是规定了分布式事务实现的骨架,并没有规定具体如何实现,比如事务协调器是作为一个单独应用存在,还是与事务发起方一起部署的?事务参与者是单独的应用还是与发起方一起的?并且并没有考虑异常情况,比如第二阶段如果有部分参与者返回提交失败或者由于网络原因返回了提交OK,但是事务协调器没有收到,该怎么处理?
另外分布式事务并不是简单说对多个数据源操作的原子性,还可以是数据源操作与远程RPC的原子性,数据源与发送消息的原子性。