分布式理论、架构设计学习:CAP定理

CAP定理是分布式计算的基础,指出一个系统无法同时保证一致性(C)、可用性(A)和分区容错性(P)。文章详细解释了C、A、P三个概念,强调在实际设计中通常需要权衡这三者。一致性要求数据在所有节点上保持最新状态,而可用性则要求系统始终能够响应请求,即使返回旧数据。分区容错性确保网络分割时系统仍能运行。最后,讨论了在面对CAP选择时的策略,如在极端情况下牺牲可用性以保证一致性和分区容错性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 介绍

2000 年7月的时候,加州大学伯克利分校的Eric Brewer 教授提出了 CAP 猜想,2年后,被 来自于麻省理工的Seth Gilbert 和 Nancy Lynch 从理论上证明了猜想的可能性,从此,CAP 定理正式在学术上成为了分布式计算领域的公认定理。并深深的影响了分布式计算的发展。

CAP 理论含义是,一个分布式系统不可能同时满足一致性(C:Consistency),可用性(A: Availability)和分区容错性(P:Partition tolerance)这三个基本需求,最多只能同时满足其中的2个。

选项描述
C 一致性分布式系统当中的一致性指的是所有节点的数据一致,或者说是所有副本的数据一致
A 可用性Reads and writes always succeed. 也就是说系统一直可用,而且服务一直保持正常
P 分区容错性系统在遇到一些节点或者网络分区故障的时候,仍然能够提供满足一致性和可用性的服务

2. C - Consistency

一致性是指写操作后读操作可以读到最新的数据状态,当数据分布在多个节点上时,从任意节点读取到的数据都是最新的

商品信息读写要满足一致性需要实现如下目标:

  • 商品服务写入主数据库成功, 则想从数据库查询数据也成功
  • 商品服务写入主数据库失败,则向从数据库查询也失败

如何实现一致性?

  • 写入主数据库后要数据同步到从数据库
  • 写入主数据库后,在向从数据库同步期间要将从数据库锁定, 等待同步完成后在释放锁,以免在写新数据后,向从数据库查询到旧的数据

分布式一致性的特点:

  • 由于存在数据库同步过程,写操作的响应会有一定的延迟
  • 为了保定数据的一致性,对资源暂时锁定,待数据同步完成后释放锁定资源
  • 如果请求数据同步失败的节点则会返回错误信息,一定不会返回旧数据

3. A - Availability

可用性是指任何操作都可以得到响应的结果,且不会出现响应超时或响应错误。
商品信息读写要满足可用性需要实现如下目标:

  • 从数据库接收到数据库查询的请求则立即能够响应数据查询结果
  • 从数据库不允许出现响应超时或错误

如何实现可用性?

  • 写入主数据库后要将数据同步到从数据
  • 由于要保证数据库的可用性,不可以将数据库中资源锁定
  • 即使数据还没有同步过来,从数据库也要返回查询数据, 哪怕是旧数据,但不能返回错误和超时

4. P - Partition tolerance

分布式系统的各个节点部署在不同的子网中, 不可避免的会出现由于网络问题导致节点之间通信失败,此时仍可以对外提供服务,这个就是分区容错性 (分区容忍性)

商品信息读写要满足分区容错性需要实现如下目标:

  • 主数据库想从数据库同步数据失败不影响写操作
  • 其中一个节点挂掉不会影响另一个节点对外提供服务

如何实现分区容错性?

  • 尽量使用异步取代同步操作,举例 使用异步方式将数据从主数据库同步到从数据库, 这样节点之间能有效的实现松耦合
  • 添加数据库节点,其中一个从节点挂掉,由其他从节点提供服务

5. CAP 选择策略

CAP只能 3 选 2

为什么CAP不能同时满足
  • 假设有一个系统如下:

    有用户向N1发送了请求更改了数据,将数据库从V0更新成了V1。由于网络断开,所以N2数据库依然是V0,如果这个时候有一个请求发给了N2,但是N2并没有办法可以直接给出最新的结果V1,这个时候该怎么办呢?
    两种方法:
    第一种是将错就错,将错误的V0数据返回给用户。
    第二种是阻塞等待,等待网络通信恢复,N2中 的数据更新之后再返回给用户。
    显然前者牺牲了一致性,后者牺牲了可用性。
    这个例子虽然简单,但是说明的内容却很重要。在分布式系统当中,CAP三个特性我们是无法同时满足的,必然要舍弃一 个。三者舍弃一个,显然排列组合一共有三种可能。

  • 舍弃A(可用性),保留CP(一致性和分区容错性)
    一个系统保证了一致性和分区容错性,舍弃可用性。也就是说在极端情况下,允许出现系统无法访问的情况出现,这个 时候往往会牺牲用户体验,让用户保持等待,一直到系统数据一致了之后,再恢复服务。

  • 舍弃C(一致性),保留AP(可用性和分区容错性)
    这种是大部分的分布式系统的设计,保证高可用和分区容错,但是会牺牲一致性。

  • 舍弃P(分区容错性),保留CA(一致性和可用性)
    如果要舍弃P,那么就是要舍弃分布式系统,CAP也就无从谈起了。可以说P是分布式系统的前提,所以这种情况是不存在的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值