Hadoop HDFS概念以及查看fsimage和edit日志文件

本文详细解析了Hadoop的HDFS文件系统架构,重点介绍了NameNode的角色及其实现机制,包括其如何保存数据块映射和操作记录,SecondaryNameNode的备份原理及其在数据恢复中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

    Hadoop的HDFS文件系统是采用主从结构的。master就是NameNode.NameNode不保存实际的操作数据,而是保存数据到数据块的映射,以及数据的操作记录。可以理解为NameNode就是fsimage+editlog。那么什么是fsimage呢?fs就是目录的意思,image就是图片,可以理解为目录树。就是文件映射到DataNode的记录树。editlog就是文件读写的记录。SecondaryNameNode是NameNode的冷备份,他的工作就是定期的从NameNode获取fsimage和edit进行合并,然后再发送个NameNode.假设NameNode文件结构损坏,可以从SecondaryNameNode进行恢复数据。之所以说是冷备份,就是因为他不会替代NodeNode,而是作为恢复数据的一个依据或者容灾解决方案!

 

    而热备份就是主节点挂了,备用节点开始承担主节点的工作。冷备份仅仅作为恢复数据而存在,并且恢复的是一部分数据,SecondaryNameNode默认一小时合并一次fsimage和edit日志,也就是最坏情况下丢失1个小时数据。那么fsimage在什么地方呢?是在我们hadoop的临时目录下。我的目录在/usr/local/hadoop/tmp/dfs/name/current下面:

上面的全是edit操作日志。可以使用hdfs 命令转换为xml查看:

hdfs oev -i edits_0000000000000000438-0000000000000000439 -o /usr/local/hadoop/edits.xml

fsimage可以使用如下命令:

hdfs oiv -i fsimage_0000000000000000439 -o /usr/local/hadoop/fsimage.txt

-i表示输入文件的位置

-o表示输出文件的位置

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值