Hadoop深入学习:HDFS主要流程——SNN合并fsimage和编辑日志

本文详细介绍了HDFS中SecondaryNameNode如何通过合并FSImage文件和编辑日志来减轻NameNode重启时的恢复负担。通过定期创建检查点,缩短了系统恢复时间。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本节我们主要写Secondary NameNode是如何合并命名空间文件和编辑日志文件。
客户端对HDFS的文件系统目录树进行的任何修改,都会被记录到编辑日志文件中,以保证系统出现故障后,能够根据这些日志进行恢复,但是随着日志不断地增长,这意味着系统从气候,需要进行恢复的时间也就越长。为了避免这一情况的发生,HDFS引入了检查点机制。
命名空间镜像(FSImage)文件文件系统的持久性检查点,和编辑日志不同,它不能再客户端度HDFS做的每次修改后都及时更新。故命名空间镜像再加上编辑日志,NameNode节点的元数据提供了安全保障。
[b]在NameNode启动时,首先会将磁盘上的fsiamge命名空间镜像文件读入内存,恢复到某个时间的检查点,然后再读取编辑日志,进行重建。[/b]
Hadoop中引入了第二命名节点Secondary NameNode节点,就是为了解决编辑日志谁时间不端的增长,如果NameNode节点重启后要花很长时间来执行编辑日志中的每一个操作这种情况。

Secondary NameNode节点的工作流程:
1)、定期的通过远程方法获取NameNode节点上编辑日的大小;
2)、如果NameNode节点上编辑日很小,就不需要合并NameNode上的fsimage文件和编辑日志;
3)、通过远程接口启动一次检查点过程,这是名字节点需要创建一个新的编辑日志文件edits.new,后续对文件系统的任何修改都记录到这个新编辑日志里;
4)、第二名字节点将Namenode上的fsimage文件和原编辑日志下载到本地,并在内存中合并,合并的结果输出为fsimage.ckpt;
5)、再次发起请求通知NameNode节点数据(fsimage.ckpt)已准备好,然后NameNode节点会下载fsimage.ckpt;
6)、NameNode下载结束后,Secondary NameNode会通过远程调用(NameNodeProtocol.rollFsImage())完成这次检查点,NameNode在响应该远程调用时,会用fsimage.ckpt覆盖原来的fsimage文件,形成新的命名空间镜像,同时将新的编辑日志edits.new改名为edits。
整个流程如下图示:
[img]http://dl2.iteye.com/upload/attachment/0084/9875/711bf080-df21-3400-836b-77e4212e3caa.jpg[/img]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值