分布式系统中的权衡与服务发现
1. CAP 定理下的权衡
1.1 牺牲可用性(CP 系统)
当我们需要保证一致性时,每个数据库节点都需要确保其持有的数据副本与其他节点一致。在网络分区的情况下,如果数据库节点之间无法通信,它们就无法协调以保证一致性。此时,为了保证一致性,唯一的选择就是拒绝响应请求,这意味着牺牲了可用性,这样的系统属于 CP(一致性和分区容错性)系统。
在多节点间实现一致性非常困难。例如,当我们从本地数据库节点读取记录时,为了确保记录是最新的,需要向其他节点询问,并且在读取完成前要求其他节点不允许更新该记录,这就需要在多个数据库节点间发起事务性读取。然而,事务性读取速度慢,需要加锁,可能会阻塞整个系统。而且在分布式系统中,锁的管理更加困难,即使在单进程系统中,锁的实现也并非易事。
强烈建议,如果需要多节点一致性,不要自己开发,而是选择提供这种特性的数据存储或锁服务,如 Consul 实现了强一致性的键值存储,用于在多个节点间共享配置。
1.2 牺牲分区容错性(CA 系统)
根据 CAP 定理,我们可以选择其中两个特性。AP 系统最终一致,易于扩展和构建;CP 系统一致性强,但构建和扩展困难。那么是否可以选择 CA 系统呢?实际上,若系统没有分区容错性,就不能在网络上运行,它必须是本地运行的单进程,所以在分布式系统中不存在 CA 系统。
1.3 AP 还是 CP 的选择
选择 AP 还是 CP 取决于具体情况。作为系统构建者,我们知道 AP 系统更易扩展和构建,而 CP 系统因支持分布式一致性面临挑战,需要更多工作。但我们可能不了解这种权衡对业务的影响。例如