05-zk 日志和快照

zookeeper日志和快照

  • 在zookeeper的配置文件zoo.cfg文件中,dataDir对应的是快照日志文件保存路径,dataLogDir对应的是事务日志文件,当我们直接查看日志文件时,看到是二进制文件,我们无法直接解读。

一、事物日志

  • 事务日志指zookeeper系统在正常运行过程中,针对所有的写操作,在返回客户端“更新成功”的响应前,zookeeper会保证已经将本次更新操作的事务日志已经写到磁盘上,
    只有这样,整个更新操作才会生效。文件的命名规则是log.xx,xx是16进制表示的第一个写入的事物的ID

1.1 查看事物日志

  • zookeeper提供了LogFormatter工具进行转换,查看事务日志内容,命令如下:
java -classpath .:lib/slf4j-api-1.7.25.jar:zookeeper-3.4.14.jar org.apache.zookeeper.server.LogFormatter /opt/zookeeper/transactionLog/version-2/log.4

其中:/opt/zookeeper/transactionLog/version-2/log.4是日志路径下的日志文件
命令是在zookeeper的bin目录下执行的,因此使用.:lib
zookeeper-3.4.14.jar表示我所使用的zk版本是3.4.12版本
  • 截取部分日志内容如下(这是我使用zookeeper测试了分布式锁之后的事物日志):
6/14/19 12:47:42 PM CST session 0x1006bbdec860091 cxid 0xe7 zxid 0x5c9 closeSession null
6/14/19 12:47:42 PM CST session 0x1006bbdec8600d3 cxid 0x6c zxid 0x5ca create '/lock,,v{s{31,s{'world,'anyone}}},T,198

6/14/19 12:47:42 PM CST session 0x1006bbdec8600bf cxid 0x9a zxid 0x5cb error -110

6/14/19 12:47:42 PM CST session 0x1006bbdec86009c cxid 0xc2 zxid 0x5cc error -110

6/14/19 12:47:42 PM CST session 0x1006bbdec8600d3 cxid 0x6d zxid 0x5cd delete '/lock

6/14/19 12:47:42 PM CST session 0x1006bbdec8600d3 cxid 0x6e zxid 0x5ce closeSession null
6/14/19 12:47:42 PM CST session 0x1006bbdec86009c cxid 0xc7 zxid 0x5cf create '/lock,,v{s{31,s{'world,'anyone}}},T,199

6/14/19 12:47:42 PM CST session 0x1006bbdec8600bf cxid 0x9f zxid 0x5d0 error -110

6/14/19 12:47:42 PM CST session 0x1006bbdec86009c cxid 0xc8 zxid 0x5d1 delete '/lock

6/14/19 12:47:42 PM CST session 0x1006bbdec86009c cxid 0xc9 zxid 0x5d2 closeSession null
6/14/19 12:47:42 PM CST session 0x1006bbdec8600bf cxid 0xa4 zxid 0x5d3 create '/lock,,v{s{31,s{'world,'anyone}}},T,200

6/14/19 12:47:42 PM CST session 0x1006bbdec8600bf cxid 0xa5 zxid 0x5d4 delete '/lock

6/14/19 12:47:42 PM CST session 0x1006bbdec8600bf cxid 0xa6 zxid 0x5d5 closeSession null

1.2 事物日志配置

  • 配置项dataLogDir是事物日志的存储路径。事务日志对ZooKeeper的影响非常大,强烈建议事务日志目录和数据目录分开,不要将事务日志记录在数据目录(主要用来存放内存数据库快照)下。
dataLogDir=/opt/zookeeper/transactionLog

二、快照日志

  • 事物日志可以理解为zookeeper记录了相关的事物操作,而快照日志则可以理解是将全部的数据做一次完整的序列化,比如zk运行了很久之后,内存中的
    使用树形结构组织起来的数据有很多,将这些数据全部序列化后以文件的形式存储即为快照日志。假如在t1时刻保存了完整的快照日志,那么t1之前的所有
    事物日志即使全部丢失,也可以还原t1时刻zookeeper的状态。
  • zookeeper快照文件的命名规则为snapshot.xx,xx表示zookeeper触发快照的那个瞬间,提交的最后一个事务的ID。

2.1 查看快照日志

  • zookeeper提供了SnapshotFormatter 工具进行转换,查看快照日志内容,命令如下:
java -classpath .:lib/slf4j-api-1.7.25.jar:zookeeper-3.4.14.jar org.apache.zookeeper.server.SnapshotFormatter /opt/zookeeper/snapshotLog/version-2/snapshot.12154
  • 还是在zookeeeper的主目录下面执行,因此lib使用的是.代表当前路径,snapshotLog是我的快照日志存储路径
  • 截取部分快照日志内容如下(这是我使用zookeeper测试了分布式锁之后的事物日志):
ZNode Details (count=5):
----
/
  cZxid = 0x00000000000000
  ctime = Thu Jan 01 08:00:00 CST 1970
  mZxid = 0x00000000000000
  mtime = Thu Jan 01 08:00:00 CST 1970
  pZxid = 0x00000000012154
  cversion = 16706
  dataVersion = 0
  aclVersion = 0
  ephemeralOwner = 0x00000000000000
  dataLength = 0
----
/lock
  cZxid = 0x00000000012154
  ctime = Fri Jun 14 14:02:39 CST 2019
  mZxid = 0x00000000012154
  mtime = Fri Jun 14 14:02:39 CST 2019
  pZxid = 0x00000000012154
  cversion = 0
  dataVersion = 0
  aclVersion = 0
  ephemeralOwner = 0x100704397b24141
  no data
----
/zookeeper
  cZxid = 0x00000000000000
  ctime = Thu Jan 01 08:00:00 CST 1970
  mZxid = 0x00000000000000
  mtime = Thu Jan 01 08:00:00 CST 1970
  pZxid = 0x00000000000000
  cversion = 0
  dataVersion = 0
  aclVersion = 0
  ephemeralOwner = 0x00000000000000
  dataLength = 0
----
/zookeeper/quota
  cZxid = 0x00000000000000
  ctime = Thu Jan 01 08:00:00 CST 1970
  mZxid = 0x00000000000000
  mtime = Thu Jan 01 08:00:00 CST 1970
  pZxid = 0x00000000000000
  cversion = 0
  dataVersion = 0
  aclVersion = 0
  ephemeralOwner = 0x00000000000000
  dataLength = 0
----
Session Details (sid, timeout, ephemeralCount):
0x100704397b24141, 30000, 1
0x100704397b24142, 30000, 0

2.2 快照日志配置

  • 配置项dataDir是快照日志的存储路径
dataDir=/opt/zookeeper/snapshotLog

三、日志清理

  • 可以配置快照日志和事物日志的清理频率和快照日志文件保存的个数
配置作用默认值
autopurge.snapRetainCount开启自动清理功能后清理时要保留的版本数量。默认值为3,最小值也为3
autopurge.purgeInterval指定触发自动清理功能的时间间隔,单位为小时,值为大于或等于1的整数默认值为0,表示不开启自动清理功能
dataDir快照日志存储路径默认是/tmp下面
dataLogDir事物日志存储路径
preAllocSize事物日志预先开辟大小64MB (每个事务日志大小就是64M)
snapCount写多少次事务日志后进行一次快照100000(也就是默认进行了10W次事物之后,拍一次快照)

四、事物日志和快照日志的关联

  • ZooKeeper集群中的每个服务器节点每次接收到写操作请求时,都会先将这次请求发送给leader,leader将这次写操作转换为带有状态的事务,然后leader会对这次写操作广播出去以便进行协调。当协调通过(大多数节点允许这次写)后,
    leader通知所有的服务器节点,让它们将这次写操作应用到内存数据库中,并将其记录到事务日志中。当事务日志记录的次数达到一定数量后(默认10W次),就会将内存数据库序列化一次,使其持久化保存到磁盘上,序列化后的文件称
    为"快照文件"。每次拍快照都会生成新的事务日志。有了事务日志和快照,就可以让任意节点恢复到任意时间点(只要没有清理事务日志和快照)。
  • 事物日志和快照日志可用于zookeeper恢复数据,假设t1时刻保存了快照日志,t1到t2时刻保存了事物日志(这段时间内没有再新增快照),那么t2时刻重启zookeeper,数据不会丢失
  • 快照相当于将当前的zookeeper状态记录了下来,保留了快照之后,该快照之前创建的快照和事物日志丢失是没有影响的。
  • 如果t1时刻保存了快照,但是t1到t2的事物日志丢失并且后面也没有快照,那么t1到t2之间的数据无法恢复,只能恢复到t1时刻的状态。

五、zookeeper系统日志

  • 前面的事物日志和快照日志是zookeeper在作为一个分布式协调者对外提供功能的日志,保证数据的恢复,那么zookeeper作为一个组件,还有自己的运行日志。zookeeper的运行日志是有log4j来配置。

5.1 配置

  • ZooKeeper使用的log4j的配置文件为$ZOOKEEPER_HOME/conf/log4j.properties。

5.2 路径

  • 默认情况下,系统日志文件为ZooKeeper安装目录下的zookeeper.out。如下是zkServer.sh文件中的一行内容,并且在使用start选项启动zookeeper的时候,日志会输出到"$ZOO_LOG_DIR/zookeeper.out"中。
_ZOO_DAEMON_OUT="$ZOO_LOG_DIR/zookeeper.out"

六、小结

  • 本文主要了解zookeeper的事物日志,快照日志和系统日志,了解相关的配置和基本操作。

七、参考

<think>嗯,用户现在想查找关于使用zk-shell脚本进行ZooKeeper备份恢复的指南。之前我已经在之前的回答中提到了几种备份恢复工具,包括zk-shell脚本的方法。现在需要更详细地指导用户如何使用zk-shell进行备份恢复。 首先,我需要回忆一下zk-shell的基本用法。根据引用[3]提到的环境搭建,用户可能是在一个CentOS系统上,使用ZooKeeper 3.4.10。zk-shell是一个命令行工具,需要安装,可能需要Python环境。记得安装命令大概是pip install zk-shell?或者需要从GitHub克隆?需要确认安装步骤。 接下来,备份的核心步骤是通过zk-shell连接到ZooKeeper实例,然后导出指定路径的数据。用户可能需要知道具体的命令,比如使用dump命令保存节点数据为JSON文件。恢复时则是使用load命令将JSON文件导入到目标路径。同时,需要注意权限问题,比如ACL是否会被备份,根据之前的回答,zk-shell脚本可能不支持权限备份,所以需要提醒用户这一点。 另外,用户提供的引用[1]提到使用LogFormatter类查看事务日志,这可能备份恢复有关联,但用户现在的问题是关于zk-shell,所以暂时可以不深入这部分,但可能需要提到日志快照文件作为备份的另一种方式,供用户参考。 需要确保步骤清晰,包括安装zk-shell、备份命令、恢复命令,以及注意事项,比如处理大型数据时的性能问题,是否需要停止ZooKeeper服务等。此外,用户可能关心如何自动化这些脚本,是否可以结合cron定时任务,或者集成到现有的运维流程中。 还要考虑用户的环境,比如是否有多节点集群,是否需要跨节点备份,或者如何确保备份的一致性。但根据用户当前的问题,主要是针对zk-shell的具体操作,所以先集中在基本操作上,如果有高级需求再进一步扩展。 最后,生成相关问题,引导用户了解其他备份方法或者深入zk-shell的高级用法。比如如何增量备份,如何处理备份过程中的连接问题,或者如何验证备份文件的完整性。</think>### 基于zk-shell的ZooKeeper备份与恢复操作指南 以下是使用`zk-shell`脚本进行ZooKeeper数据备份与恢复的详细步骤注意事项,结合引用[1]中提到的日志/快照文件管理方法,提供完整的操作流程: --- #### **1. 安装zk-shell** `zk-shell`是基于Python的命令行工具,需确保环境满足以下条件: - Python 3.6+(推荐Python 3.8) - pip包管理器 ```bash # 安装zk-shell pip install zk-shell ``` 若安装失败,可尝试从GitHub直接安装: ```bash git clone https://github.com/rgs1/zk_shell.git cd zk_shell python setup.py install ``` --- #### **2. 数据备份操作** ##### **2.1 备份指定路径** 通过`dump`命令将ZooKeeper节点数据导出为JSON格式文件(支持递归备份子节点): ```bash # 连接到ZooKeeper服务器(默认端口2181) zk-shell localhost:2181 # 进入交互模式后执行备份(例如备份根路径) dump / /tmp/zookeeper_backup.json ``` *说明*: - 备份文件包含节点数据、ACL权限(若存在)及节点结构[^1]。 - 若需备份特定路径(如`/config`),替换命令中的根路径`/`为目标路径即可。 ##### **2.2 结合快照日志文件(增强可靠性)** 根据引用[1],ZooKeeper的事务日志快照文件可用于恢复历史状态。建议在备份数据时同步记录当前快照版本: ```bash # 查看最新快照文件(默认路径:/tmp/zookeeper/snapshot) ls -l /tmp/zookeeper/snapshot | tail -n 1 # 记录快照文件名(如:snapshot.100000001) ``` --- #### **3. 数据恢复操作** ##### **3.1 从JSON文件恢复** 使用`load`命令将备份文件导入目标ZooKeeper集群: ```bash zk-shell new_zookeeper:2181 # 连接到目标集群 load /tmp/zookeeper_backup.json / ``` *注意事项*: - 若目标路径已存在同名节点,默认会覆盖数据(需确认权限是否允许写入)。 - 恢复过程中建议关闭客户端写入操作,避免数据冲突[^1]。 ##### **3.2 使用历史快照恢复(备用方案)** 若需回滚到特定历史状态(如备份文件损坏): ```bash # 停止ZooKeeper服务 bin/zkServer.sh stop # 替换数据目录(假设数据目录为/tmp/zookeeper) cp -r /backup/snapshot.100000001 /tmp/zookeeper/snapshot/ cp /backup/log.100000001 /tmp/zookeeper/log/ # 重启服务 bin/zkServer.sh start ``` --- #### **4. 自动化脚本示例** 结合Shell脚本实现定时备份(每日凌晨执行): ```bash #!/bin/bash BACKUP_DIR="/opt/zookeeper_backups" DATE=$(date +%Y%m%d) ZK_HOST="localhost:2181" # 创建备份目录 mkdir -p $BACKUP_DIR/$DATE # 使用zk-shell备份数据 echo "dump / $BACKUP_DIR/$DATE/zk_data.json" | zk-shell $ZK_HOST # 备份最新快照文件 LATEST_SNAP=$(ls -t /tmp/zookeeper/snapshot | head -n1) cp /tmp/zookeeper/snapshot/$LATEST_SNAP $BACKUP_DIR/$DATE/ ``` --- #### **关键注意事项** 1. **权限一致性**: `zk-shell`默认备份ACL信息,但若目标集群认证模式不同(如Kerberos),需手动调整权限配置[^1]。 2. **大文件处理**: 若节点数据量较大(如超过100MB),建议分路径备份或调整JVM内存参数: ```bash export JVMFLAGS="-Xmx2G" && zk-shell localhost:2181 ``` 3. **集群环境**: 在分布式集群中,只需从一个节点备份数据(ZooKeeper保证数据一致性)[^1]。 --- ### 对比其他方案 | 特性 | zk-shell脚本 | Python工具[^1] | 快照文件恢复 | |---------------------|--------------------|-------------------|--------------------| | 依赖环境 | Python + Shell | Python | ZooKeeper服务 | | 数据格式 | JSON | XML | 二进制 | | ACL支持 | 是 | 部分支持 | 完全保留 | | 适用场景 | 中小规模数据 | 需权限同步 | 灾难恢复 | --- ### 相关问题 1. **如何验证备份文件的完整性与一致性?** 2. **在ZooKeeper集群扩容后,备份恢复策略需要做哪些调整?** 3. **zk-shell备份过程中出现连接中断应如何修复?**
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值