ZooKeeper能解决什么问题？不能解决什么问题？

最新推荐文章于 2025-02-07 23:03:53 发布

转载最新推荐文章于 2025-02-07 23:03:53 发布 · 393 阅读

文章标签：

本文深入探讨ZooKeeper的设计理念，解析其如何简化分布式应用开发，提供高效、可靠的分布式协调服务。ZooKeeper通过屏蔽底层细节，如消息延迟、处理器性能和时钟偏移等问题，确保应用程序专注于业务逻辑。此外，文章还介绍了ZooKeeper的API，以及其在统一命名、分布式锁、进程崩溃检测、Leader选举和配置管理等方面的应用。

来源 | https://urlify.cn/67BZnm

ZooKeeper 很流行，有个基本的疑问：

ZooKeeper 是用来做什么的？
之前没有ZK，为什么会诞生 ZK？

OK，解答一下上面的疑问：（下面是凭直觉说的）

ZooKeeper 是用于简化分布式应用开发的，对开发者屏蔽一些分布式应用开发过程中的底层细节
ZooKeeper 对外暴露简单的 API，用于支持分布式应用开发
ZooKeeper 在提供上述功能的同时，其还是一个高性能、高可用、高可靠的分布式集群

上面说这么多，总结一下，ZK 能解决分布式应用开发的问题，ZK 能很好的解决问题。到这一步，疑问就更多了：

分布式应用开发，有哪些常见问题？ZK 是如何屏蔽这些底层细节的？
ZooKeeper 对外暴露了那些 API？这些 API 如何支持分布式应用开发的？这些 API 还能简化吗？API 的语义性怎么样？
ZooKeeper 自身是一个高性能、高可用、高可靠的分布式集群，那有个简单的问题：

高性能是指什么？ZooKeeper 为了达到高性能，做了哪些工作？
高可用同上
高可靠同上

Note：本篇 wiki 就是为了解决上述第一个疑问的。（其他疑问会在其他 blog 中逐步解答）

为什么有 ZooKeeper

一个应用程序，涉及多个进程协作时，业务逻辑代码中混杂有大量复杂的进程协作逻辑。

上述多进程协作逻辑，有 2 个特点：

处理复杂
处理逻辑可重用

因此，考虑将多进程协作的共性问题拎出，作为基础设施，让 RD 更加专注业务逻辑开发，即：

ZooKeeper 就是上述多进程协作基础服务的一种。

ZooKeeper 的特点

ZooKeeper 有几个简单特点：

ZooKeeper 的 API：从文件系统 API 得到的启发，提供简单的 API
ZooKeeper 运行在专用服务器上，跟业务逻辑分离，保证了高容错性和可扩展性

ZooKeeper 是存储设施，但特别注意

ZK上存储的数据聚焦为：协作数据（元数据），而不是应用数据，应用数据有自己的存储方案，例如 HDFS 等
ZK 本质上，可以看作一种特殊的 FS

特别说明：

应用数据和元数据，由于使用场景不同，对一致性和持久性的要求有差异，因此，架构设计、数据治理过程中，应将 2 类数据独立看待、独立存储。

ZooKeeper 的使命

ZK 要解决的核心问题：

ZK 目标：简化分布式应用开发中，多进程协作问题。为分布式应用，提供高效、可靠的分布式协调服务（基础服务），例如：

统一的命名服务
分布式锁
进程崩溃检测
Leader 选举
配置管理：配置变更时，及时下发到各个 Client。

一个简单的问题：多进程的协作是什么？尼玛呀，有完没完，啥问题你都有，面对这个掉咋天的脑壳，还是回答一下。

多进程协作，整体分为 2 类：

协作：多进程需要一同处理某些事情，一些进程采取行动是的其他进程能够正常工作，例如：主从结构，M 向 S 分配任务，S 才会执行，否则 S 就保持空闲状态
竞争：两个进程不能同时工作，一个进程必须等待另个进程执行完毕，例如：主从结构，M 节点失效后，很多 S 都想成为 M，这时，就需要互斥锁，只有第一个获得锁的 S 成为 M

特别说明：