关于ACID与CAP理论、BASE理论

本文解析了CAP理论,重点比较了CP型(如Zookeeper)与AP型(如Eureka)在分布式注册中心的选择,讨论了Eureka如何通过牺牲一致性来提高可用性,以及BASE理论对这种权衡的补充。

CAP理论,我们通常只会在注册中心的偏向中去比较理解它。ACID(atomicity、consistency、isolation、durability、)呢?我们在传统数据库例如mysql、Oracle、SqlServer中才会探讨它。

其实CAP理论是针对非关系型数据库性能的一个比较维度:CAP:consistency 强一致性   availability 可用性   partition tolerance分区容错性

CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性、可用性、分区容错性

分布式系统,我们一般肯定是不能舍弃P 分区容错的。所以一般常见的是CP、AP性

CP型的注册中心
当向注册中心查询服务列表时,我们可以容忍注册中心返回的是几分钟以前的注册信息,但不能接受服务直接down掉不可用。也就是说,服务注册功能对可用性的要求高于一致性。但是zk会出现这一种情况,当master节 点因为网络故障与其他节点失去联系时,剩余注册功能就会重新进行leader选举看。问题在于,选举leader的时间太长,30~ 120s,且选举期间整个zk集群都是不可用的,这就导致在选举期间注册服务瘫痪。在云部看的环境下,因网络问题使得z水集群失去master节点是较大概率会发生的事,虽然服务能够最终恢复,但是浸长的选举时间导致的注册长期不可用是不能容忍的。

AP型的注册中心

Eureka看明白了这点,因此在设计时就优先保证可用性。Eureka各个 节点都是平等的,几个节点挂掉不会影响正常节点的工作,剩余节点依然可以提供注册和查询服务。

而Eureka的客户端在向某个Eureka注册或者如果发现链接失败时,则会自动切换至其他节点,只要有一台Eureka还在,就能保证注册服务可用(保证可用),只不过查到的信息可能不是最新的(不保证一致性)。除此以外,Eureka还有种自我保护机制,如果在15分钟内超过85%的节点都没有正常的心跳,那么Eureka就认为客户端与注册中心出现了网络故障,此时会出现一下几种情况:

( 1 ) Eureka不在从注册列表中移除因为长时间没收到心跳而应该过期的服务

(2) Eureka仍然能够接受新服务的注册和查询请求,但是不会被同步到其他节点上(保证当前节点依然可用)

(3)当网络稳定时,当前实例新的注册信息会被同步到其他节点中

因此,Erek可以很好的应对因网络故险导致部分节点失去联系的情况而不会像zk是整个注册服务瘫痪。
 

BASE是basically available     soft state   、eventually consistent 三个短语的简写,该理论是对CAP中一致性和可用性权衡的结果,是由CAP演化而来的。

根据单词,大家应该能够理解其作用。我这里只写下 soft state的解释,软状态或者我们称为弱状态,指系统中的数据存在中间状态,并且该状态的存在不会影响整体的可用性,即允许系统在不同节点的数据副本之间进行数据同步的过程存在延时。

这些理论的概念,大家还是需要知道的,宏观的一些东西,就像骨架,先有了一部分支撑,才后来有了肉,再后来才有了灵魂。

关于这些理论我推荐大家入门可以去看看一本书《从paxos到zookeeper分布式一致性原理与实践》这本书里面讲了很多分布式系统的问题,以及如何解决这些问题,与此同时还提炼了一些理论。


 

### ACID理论CAP理论BASE理论适用的数据库类型对比 #### ACID理论 ACID(Atomicity, Consistency, Isolation, Durability)是一组用于保证数据库事务可靠执行的标准。该理论主要适用于传统的单体关系型数据库,如MySQL、PostgreSQL和Oracle等。这些数据库通过严格的事务管理来确保数据的一致性和可靠性[^2]。 - **原子性 (Atomicity)**:事务中的所有操作要么全部完成,要么都不执行。 - **一致性 (Consistency)**:事务完成后,数据库的状态必须符合预定的约束条件。 - **隔离性 (Isolation)**:多个事务并发执行时互不影响。 - **持久性 (Durability)**:一旦事务提交,其结果将是永久保存的。 这类数据库通常被设计成CA模式,即在非分布式环境中提供高一致性和可用性,但在扩展性和分区容忍能力方面较弱[^3]。 #### CAP理论 CAP定理表明,在一个分布式计算系统中,不可能同时满足一致性(C),可用性(A)和分区容错性(P)[^1]。因此,现代分布式数据库往往会在三者之间做出取舍: - **CP类数据库**:当网络分区发生时,优先保证数据的一致性和分区容忍性,可能会降低系统的可用性。例如HBase就是一个典型的例子。 - **AP类数据库**:为了提高用户体验,即使在网络出现问题的情况下也能继续工作,但可能暂时失去强一致性。像Cassandra这样的NoSQL数据库属于这一类别。 #### BASE理论 BASE(Basically Available, Soft state, Eventually consistent)是一种针对大规模互联网应用提出的宽松数据处理方案,它提倡放弃即时性强一致性的追求,转而接受一定时间窗口内的最终一致性[^4]。这种方法非常适合用来构建高度可伸缩的NoSQL存储系统,比如DynamoDB、MongoDB等。 以下是三种理论及其对应数据库类型的简单对比表: | 理论/特性 | 传统关系型数据库 | 分布式数据库(AP为主) | 分布式数据库(CP为主) | |----------------|------------------------------------|----------------------------------|------------------------------| | **ACID** | ✔️ | ❌ | ❌ | | **CAP - C** | ✔️ | ❌ | ✔️ | | **CAP - A** | ✔️ | ✔️ | ❌ | | **CAP - P** | ❌ | ✔️ | ✔️ | | **BASE** | ❌ | ✔️ | 部分场景下也可能适用 | ```sql -- 示例 SQL 查询展示事务控制语句体现ACID特性 BEGIN TRANSACTION; UPDATE accounts SET balance = balance - 100 WHERE account_id = 1; UPDATE accounts SET balance = balance + 100 WHERE account_id = 2; COMMIT; ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值