定义
CAP
定理是
2000
年,由
Eric Brewer
提出来的。
Brewer
认为在分布式的环境下设计和部署系统
时,有
3
个核心的需求,以一种特殊的关系存在。
这
3
个核心的需求是:
Consistency
,
Availability
和
Partition Tolerance
CAP定理认为:一个提供数据服务的存储系统无法同时满足数据一致性、数据可用性、分区容忍 性
概念
Consistency:
一致性,这个和数据库
ACID
的一致性类似,但这里关注的所有数据节点上的数据一致性和正
确性,而数据库的
ACID
关注的是在在一个事务内,对数据的一些约束。
系统在执行过某项操作后仍然处于一致的状态。在分布式系统中,更新操作执行成功后所有的
用户都应该读取到最新值。
Availability:
可用性,每一个操作总是能够在一定时间内返回结果。需要注意
“
一定时间
”
和
“
返回结果
”
。
“
一定时间
”
是指系统结果必须在给定时间内返回。
“
返回结果
”
是指系统返回操作成功或失败的结果。
Partition Tolerance:
分区容忍性,是否可以对数据进行分区。这是考虑到性能和可伸缩性。
推导
如果要求对数据进行分区了,就说明了必须节点之间必须进行通信,涉及到通信,就无法确保在有限的时间内完成指定的任务
如果要求两个操作之间要完整的进行,因为涉及到通信,肯定存在某一个时刻只完成一部分的业务 操作,在通信完成的这一段时间内,数据就是不一致性的。
如果要求保证一致性,那么就必须在通信完成这一段时间内保护数据,使得任何访问这些数据的操
作不可用。
结论
在大型网站应用中,数据规模总是快速扩张的,因此可伸缩性即分区容忍性必不可少,规模变大以 后,机器数量也会变得庞大,这是网络和服务器故障会频繁出现,要想保证应用可用,就必须保证 分布式处理系统的高可用性。
在大型网站中,通常会选择强化分布式存储系统的可用性和伸缩性,在某种程度上放弃一致性