zookeeper学习笔记

本文详细介绍ZooKeeper的特性,包括其强大的一致性保障、顺序性和事务性等。文章还提供了详细的安装配置步骤,涵盖单机及集群环境,并深入解析了ZooKeeper的内部工作原理,如选举机制和数据写入流程等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

zookeeper

一.简介

1.概述

用于分布式管理的工具,文件系统+通知机制

2.特点

1.集群可用

一领导者,多跟随者。集群中半数以上的服务可用,则整个集群可用。

2.强一致性,

访问任意服务获取到的数据都是最新的。

3.顺序性

同一个客户端发送的消息,按照顺序处理。

4.事务性

客户端的请求要么成功要么失败

3.数据结构

数据结构模型与UNIX文件系统类似,每个节点为ZNODE,ZNODE默认可以存储1M数据,使用路径作为节点的唯一标识。

二.安装配置

1.单机安装配置

1.下载

直接下载个bin包就行了。没有安装jdk的需要先安装jdk
wget https://zookeeper.apache.org/releases.html
tar -xvfz apache-zookeeper-3.6.2-bin.tar.gz

2.更改配置文件

cd ./apache-zookeeper-3.6.2-bin/conf
cp zoo_sample.cfg zoo.cfg

3.启动

cd ./apache-zookeeper-3.6.2-bin/bin
./zkServer.sh start

2.集群安装配置

1. 复制文件夹

mkdir zkcluster` `cp apache-zookeeper-3.6.2-bin ./zkcluster/zk1` `cp -r apache-zookeeper-3.6.2-bin ./zkcluster/zk1` `cp -r apache-zookeeper-3.6.2-bin ./zkcluster/zk2` `cp -r apache-zookeeper-3.6.2-bin ./zkcluster/zk3

2.创建数据文件夹

mkdir ./zkcluster/zk1/data` `mkdir ./zkcluster/zk2/data` `mkdir ./zkcluster/zk3/data

3.添加myid文件

touch ./zkcluster/zk1/data/myid` `touch ./zkcluster/zk2/data/myid` `touch ./zkcluster/zk3/data/myid` `echo "1" > ./zkcluster/zk1/data/myid` `echo "2" > ./zkcluster/zk2/data/myid` `echo "3" > ./zkcluster/zk3/data/myid

4.分别修改服务配置

修改:

dataDir=/root/zkcluster/zk1/data
dataLogDir=/root/zkcluster/zk1/log
clientPort=2183

添加:

#1 2 3 代表myid中配置的
#第一个端口集群内部数据复制 第二个选举
server.1=0.0.0.0:2888:3888
server.2=0.0.0.0:2889:3889
server.3=0.0.0.0:2890:3890

5. 启动集群

./zk1/bin/zkServer.sh start` `./zk2/bin/zkServer.sh start` `./zk3/bin/zkServer.sh start

三.内部原理

1.选举机制

集群服务依次启动,当半数以上服务启动后,整个集群可用,选举一个id最大的服务作为领导者,其他服务以及后续启动的服务为跟随者。

2.节点类型

1:PERSISTENT // 持久化节点
2:PERSISTENT_SEQUENTIAL // 持久化排序节点
3:EPHEMERAL // 临时节点
4:EPHEMERAL_SEQUENTIAL // 临时排序节点

永久节点:节点创建后会被持久化,只有主动调用delete方法的时候才可以删除节点。

临时节点:节点创建后在创建者超时连接或失去连接的时候,节点会被删除。临时节点下不能存在字节点

排序节点:创建的节点名称后自动添加序号,如节点名称为"node-",自动添加为"node-1",顺序添加为"node-2"…。排序序号由父节点维护。

3.集群服务数量建议

zookeeper集群建议启动奇数个服务。例如5个服务,3个不可用整个集群不可用。6个服务,3个不可用整个集群也不可用。所以启动6个相当于浪费了资源。

4.数据写入流程

客户端向服务写入数据,如果服务不是领导者,则转发给领导者。
领导者广播给其他跟随者,跟随者回复给领导者是否写入成功。
领导者统计成功数量,如果超过一半的服务写入成功则,通知与客户端连接的服务写入成功。
服务发送结果给客户端通知结果。

四.CAP理论:

1.一致性(Consistency):

分布式系统中,数据副本在任意时刻都一一样的。也就是说不会获取到旧数据。

2.可用性(Availability):

客户端请求后一定时间内必须给出回应。

3.分区容错(Partition tolerance):

子网络之间可能无法通信,系统必须在这种情况下继续运行。

CAP不可能同时满足。分区容错是不可避免的。所以只能存在CP、Ap。

### ZooKeeper 学习笔记 #### 1. 基本概念解析 ZooKeeper 是一个分布式的、开放源码的分布式应用程序协调服务,属于 Google Chubby 的一个开源实现[^5]。它提供了一套简单而强大的原语集,用于构建可靠的分布式系统。 - **一致性树结构**:ZooKeeper 使用层次化的命名空间来表示数据模型,类似于文件系统的目录路径。每个节点称为 znode,既可以保存少量的数据也可以作为其他 znodes 的父级容器。 - **临时节点与持久化节点**:创建时可以选择是否为临时节点;如果客户端会话结束,则该类型的znode会被自动删除。相反,对于持久化节点来说,在显式移除之前它们一直存在。 - **顺序节点**:当创建带有 SEQUENCE 标志的新节点时,Zookeeper 将为其分配一个全局唯一的递增编号并附加到名称后面形成完整的路径名。 #### 2. 最佳实践建议 为了确保高效稳定地运行 Zookeeper 集群和服务: - **合理规划集群规模**:通常情况下三台机器组成的奇数个成员构成的小型集群就足以满足大多数应用场景的需求,并能保证高可用性和容错能力。 - **配置参数优化**:调整诸如 `tickTime` (心跳间隔时间) 和 `initLimit/syncLimit` (初始化/同步限制次数)等关键属性以适应实际工作负载特点。 - **监控健康状态**:定期检查服务器日志以及通过命令行工具获取统计信息 (`mntr`) 或者四字指令(`ruok`, `stat`) 来评估整体性能表现和潜在问题所在。 ```bash echo stat | nc localhost 2181 ``` #### 3. 实际案例分析 假设有一个微服务体系架构下多个组件之间需要共享某些配置项或元数据的情况。此时就可以利用 Zookeeper 提供的服务发现功能让各个实例注册自己的地址端口等信息给中心节点,从而使得新加入的服务能够快速定位依赖对象的位置而不必硬编码这些细节于代码内部。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值