ZooKeeper数据模型Znode
在ZooKeeper中,数据信息被保存在一个个数据节点上,这些节点被称为znode。ZNode是
Zookeeper中最小数据单位,在ZNode下面又可以再挂ZNode,这样一层层下去就形成了一个层次化
命名空间ZNode树,我们称为ZNodeTree,它采用了类似文件系统的层级树状结构进行管理
在Zookeeper中,每一个数据节点都是一个ZNode,根目录下有两个节点,分别是:app1和
app2,其中app1下面又有三个子节点所有ZNode按层次化进行组织,形成这么一颗树,ZNode的节
点路径标识方式和Unix文件系统路径非常相似,都是由一系列使用斜杠(/)进行分割的路径表示,开
发人员可以向这个节点写入数据,也可以在这个节点下面创建子节点。
ZNode的类型
刚刚已经了解到,Zookeeper的znode tree是由一系列数据节点组成的,那接下来,我们就对数据节点
做详细讲解
Zookeeper节点类型可以分为三大类:
- 持久性节点(Persistent)
- 临时性节点(Ephemeral)
- 顺序性节点(Sequential)
在开发中在创建节点的时候通过组合可以生成以下四种节点类型:持久节点、持久顺序节点、临时节点、临时顺序节点。
不同类型的节点则会有不同的生命周期
持久节点:是Zookeeper中最常见的一种节点类型,所谓持久节点,就是指节点被创建后会一直存在服务器,直到删除操作主动清除
持久顺序节点:就是有顺序的持久节点,节点特性和持久节点是一样的,只是额外特性表现在顺序上。
顺序特性实质是在创建节点的时候,会在节点名后面加上一个数字后缀,来表示其顺序。
临时节点:就是会被自动清理掉的节点,它的生命周期和客户端会话绑在一起,客户端会话结束,节点会被删除掉。
与持久性节点不同的是,临时节点不能创建子节点。
临时顺序节点:就是有顺序的临时节点,和持久顺序节点相同,在其创建的时候会在名字后面加上数字后缀。
事务ID
首先,先了解,事务是对物理和抽象的应用状态上的操作集合。往往在现在的概念中,狭义上的事务通
常指的是数据库事务,一般包含了一系列对数据库有序的读写操作,这些数据库事务具有所谓的ACID特
性,即原子性(Atomic)、一致性(Consistency)、隔离性(lsolation)和持久性(Durability)
而在ZooKeeper中,事务是指能够改变ZooKeeper服务器状态的操作,我们也称之为事务操作或更新操
作,一般包括数据节点创建与删除、数据节点内容更新等操作。对于每一个事务请求,ZooKeeper都会
为其分配一个全局唯一的事务ID,用ZXID来表示,通常是一个64位的数字。每一个ZXID对应一次更
新操作,从这些ZXID中可以间接地识别出ZooKeeper处理这些更新操作请求的全局顺序
ZNode的状态信息
[zk: localhost:2181(CONNECTED)3] ls /zookeeper
[quota]
cZxid=0x0
ctime=Thu Jan 01 08:00:00 CST 1970
mZxid=0x0
mtime=Thu Jan 01 08:00:00 CST 1970
pZxid=0x0
cversion=-1
dataVersion=0
aclVersion=0
ephemeralowner=0x0
dataLength=0
numChildren=1
整个ZNode节点内容包括两部分:节点数据内容和节点状态信息。quota是数据内容,其他的属于状态信息。
那么这些状态信息都有什么含义呢?
czxid 就是CreateZXID,表示节点被创建时的事务ID。
mzxid 就是ModifiedZXID,表示节点最后一次被修改时的事务ID。
mtime 就是ModifiedTime,表示节点最后一次被修改的时间。
pzxid 表示该节点的子节点列表最后一次被修改时的事务ID。
只有子节点列表变更才会更新 pzxid,子节点内容变更不会更新。
cversion 表示子节点的版本号。
dataVersion 表示内容版本号。
aclVersion 标识ac1版本
ephemeralowner 表示创建该临时节点时的会话sessionID,如果是持久性节点那么值为0
dataLength 表示数据长度。
numChildren 表示直系子节点数。
Watcher–数据变更通知
Zookeeper使用Watcher机制实现分布式数据的发布/订阅功能
一个典型的发布/订阅模型系统定义了一种一对多的订阅关系,能够让多个订阅者同时监听某一个主题
对象,当这个主题对象自身状态变化时,会通知所有订阅者,使它们能够做出相应的处理。
在ZooKeeper中,引入了Watcher机制来实现这种分布式的通知功能。
ZooKeeper允许客户端向服务
端注册一个Watcher监听,当服务端的一些指定事件触发了这个Watcher,那么就会向指定客户端发
送一个事件通知来实现分布式的通知功能。
Zookeeper的Watcher机制主要包括客户端线程、客户端WatcherManager、Zookeeper服务器三部
具体工作流程为:客户端在向Zookeeper服务器注册的同时,会将Watcher对象存储在客户端的
WatcherManager当中。当Zookeeper服务器触发Watcher事件后,会向客户端发送通知,客户端线程
从WatcherManager中取出对应的Watcher对象来执行回调逻辑。
ACL–保障数据的安全
Zookeeper作为一个分布式协调框架,其内部存储了分布式系统运行时状态的元数据,这些元数据会直
接影响基于Zookeeper进行构造的分布式系统的运行状态,因此,如何保障系统中数据的安全,从而避
免因误操作所带来的数据随意变更而导致的数据库异常十分重要,在Zookeeper中,提供了一套完善的
ACL(Access Control List)权限控制机制来保障数据的安全。
我们可以从三个方面来理解ACL机制:
权限模式(Scheme)、授权对象(ID)、权限(Permission),
通常使用scheme:id:permission
来标识一个有效的ACL信息。
权限模式:Scheme
权限模式用来确定权限验证过程中使用的检验策略,有如下四种模式:
- IP
IP模式就是通过IP地址粒度来进行权限控制,如"ip:192.168.0.110"表示权限控制针对该IP地址,
同时IP模式可以支持按照网段方式进行配置,如“ip:192.168.0.1/24"表示针对192.168.0.*这个网段进行权限控制。 - Digest
Digest是最常用的权限控制模式,要更符合我们对权限控制的认识,其使
用"username:password"形式的权限标识来进行权限配置,便于区分不同应用来进行权限控制。
当我们通过“username:password"形式配置了权限标识后,Zookeeper会先后对其进行SHA-1加密
和BASE64编码。 - World
World是一种最开放的权限控制模式,这种权限控制方式几乎没有任何作用,数据节点的访问权限
对所有用户开放,即所有用户都可以在不进行任何权限校验的情况下操作ZooKeeper上的数据。
另外,World模式也可以看作是一种特殊的Digest模式,它只有一个权限标识,即“world:anyone"。 - Super
super模式,顾名思义就是超级用户的意思,也是一种特殊的Digest模式。在Super模式下,超级
用户可以对任意ZooKeeper上的数据节点进行任何操作。
授权对象:ID
授权对象指的是权限赋予的用户或一个指定实体,例如IP地址或是机器等。在不同的权限模式下,授
权对象是不同的,表中列出了各个权限模式和授权对象之间的对应关系。
权限模模式 | 授权对象 |
---|---|
IP | 通常是一个IP地址或IP段:例如:192.168.10.110或192.168.10.1/24 |
Digest | 自定义,通常是username:BASE64(SHA-1(username:password))例如:zm:sdfndsllndlksfn7c= |
World | 只有一个ID:anyone |
Super | 超级用户 |
权限
权限就是指那些通过权限检查后可以被允许执行的操作。在ZooKeeper中,所有对数据的操作权限分为
以下五大类:
- CREATE( C):数据节点的创建权限,允许授权对象在该数据节点下创建子节点。
- DELETE(D):子节点的删除权限,允许授权对象删除该数据节点的子节点。
- READ( R):数据节点的读取权限,允许授权对象访问该数据节点并读取其数据内容或子节点列表等。
- WRITE(W):数据节点的更新权限,允许授权对象对该数据节点进行更新操作。
- ADMIN(A):数据节点的管理权限,允许授权对象 对该数据节点进行ACL相关的设置操作。