CAP理论

本文简单阐述了CAP理论,包括一致性、可用性和分区容错性的概念,并通过示例解释了在分布式系统中如何平衡这三者。介绍了网络异常时的不同策略,如Cassandra与MySQL的同步模式。

之前有找过一些关于CAP理论的文章,今天偶然看到下面对于CAP理论的描述,个人觉得还是写的比较简单易懂的,所以摘录下来分享。

什么是 CAP 理论呢?这是 2000 年University of California, Berkeley 的计算机教授Eric Brewer(也是谷歌基础设施 VP)提出的理论。所谓 CAP,是以下 3 个单词的首字母缩写,它们都是分布式系统最核心的特性:

Consistency 一致性

Availability 可用性

Partition tolerance 分区容错性

我们通过以下 3 张示意图,快速理解下这 3 个词的意义。下图中 N1、N2 两台主机上运行着 A 进程和 B 进程,它们操作着同一个用户的数据(数据的初始值是 V0),这里 N1 和 N2 主机就处于不同的 Partition 分区中,如下所示:

 

正常情况下,当用户请求到达 N1 主机上的 A 进程,并将数据 V0 修改为 V1 后,A 进程将会把这一修改行为同步到 N2 主机上的 B 进程,最终 N1、N2 上的数据都是 V1,这就保持了系统的 Consistency 一致性。

 

然而,一旦 N1 和 N2 之间网络异常,数据同步行为就会失败。这时,N1 和 N2 之间数据不一致,如果我们希望在分区间网络不通的情况下,N2 能够继续为用户提供服务,就必须容忍数据的不一致,此时系统的 Availability 可用性更高,系统的并发处理能力更强,比如 Cassandra 数据库。

 

反之,如果 A、B 进程一旦发现数据同步失败,那么 B 进程自动拒绝新请求,仅由 A 进程独立提供服务,那么虽然降低了系统的可用性,但保证了更强的一致性,比如 MySQL 的主备同步模式。

CAP理论的核心思想是,一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance)三个特性中的两个,而无法同时满足所有三个特性。这是因为在分布式系统中,网络分区是不可避免的,而保证一致性可用性需要对网络分区做出不同的权衡[^2]。 理论的优点在于清晰简洁、易于理解,但缺点是高度抽象化,省略了很多细节,导致在将理论应用到实践时,由于各种复杂情况,可能出现误解偏差,CAP理论也不例外。如果没有意识到这些关键的细节点,那么在实践中应用CAP理论时,方案可能很难落地[^1]。 基于CAP理论,还衍生出了BASE理论,即Basic Availability(基本可用)、Soft State(软状态)Eventually Consistency(最终一致性),这是对CAP理论中AP选择的一种实践[^3]。 ### 示例代码:模拟CAP理论的简单场景 ```python # 模拟一个简单的分布式系统 class DistributedSystem: def __init__(self): self.data = {} self.available = True self.partitioned = False def set_data(self, key, value): if not self.partitioned: self.data[key] = value return True return False def get_data(self, key): if self.available and not self.partitioned: return self.data.get(key) return None # 创建分布式系统实例 system = DistributedSystem() # 设置数据 system.set_data('key1', 'value1') # 获取数据 print(system.get_data('key1')) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值