文章目录
之前我们了解分布式系统中的互斥问题及其解决方案(分布式锁)。互斥问题讨论的是多个进程对同一个临界资源进行操作的问题,而本文将要讨论的是同一个进程对多个临界资源进行操作的问题。
一. 什么是分布式事务?
简单来说,分布式事务就是跨多个独立的资源(比如数据库)进行的事务。
举个例子,假设一个银行系统需要处理一次转账操作:从A账户转出100元分别到B账户30元、C账户70元。这种操作不仅仅涉及到一个数据库,而是涉及多个资源(A账户、B账户、C账户)。这个转账操作要么完全成功,所有的账户变动都要完成;要么完全失败,没有任何账户被修改。类似这样的跨多个资源的事务,我们称之为分布式事务。
二. 分布式事务的挑战
在分布式系统中,跨多个服务和数据库执行的事务面临以下几个挑战:
- 一致性问题:如何保证数据在多个系统中保持一致?
- 网络故障:网络不稳定可能导致事务执行失败,如何保证事务不会中途丢失或被错误提交?
- 并发冲突:多个服务之间并发执行的事务如何互不干扰?
为了处理这些挑战,分布式事务采用了不同的理论和技术框架来确保数据一致性、可用性和事务的正确性。
三. 事务的ACID特性
分布式事务的核心目标是保证事务的一致性和完整性,这与单体应用中的ACID特性密切相关。ACID是事务管理的基本要求,包含以下四个特性:
- 原子性(Atomicity):事务中的所有操作要么全部成功,要么全部失败,不能部分成功。
- 一致性(Consistency):事务执行前后的数据一致,系统从一个一致性状态转变到另一个一致性状态。比如:从 A 账户转出 100元,B 账户中到账 30 元,C 账户中到账 70 元。完成这个事务操作以后,A 账户减少的钱数与 B、C 账户增加的钱数总和应该是一样的,都是 100 元。
- 隔离性(Isolation):并发执行的事务互不干扰,每个事务对外界是隔离的。
- 持久性(Durability):一旦事务提交,数据更改就会永久保存,即使系统崩溃也不丢失。
在单体架构中,ACID特性易于实现,但在分布式系统中,由于网络延迟、节点故障等问题,保证强一致性变得困难。此时,我们需要更灵活的解决方案。
四. CAP理论与BASE理论
1. CAP理论
1.1. 三大特性
在分布式系统中,由于网络和硬件的限制,无法同时保证一致性、可用性和分区容错性,这就是著名的CAP理论的核心思想。CAP理论提出,在一个分布式系统中,最多只能保证以下两个特性:
-
一致性(Consistency)