一、NameNode Namenode 是 HDFS 的元数据服务器,管理并协调数据节点 Datanode 的工作,其内存中保存整个分布式文件系统的两类元数据: (1)文件系统的名字空间,即系统目录树(恢复这个需要FsImages和Edit logs)。 (2)数据块副本与 Datanode 的映射,即副本的位置。 第(1)类元数据在 Namenode 上定期持久化,保存为镜像文件。数据块副本的位置信息没有实现持久化,而是在Namenode 启动时,通过接收 Datanode 的 Blockreport 获得。 在NameNode重启时,首先会将磁盘上(存在NameNode的磁盘上)的fsiamge命名空间镜像文件读入内存,恢复到某个时间的检查点,然后再读取编辑日志(Edit logs),进行重建(也可以成为合并)。 二、SecondaryNameNode SecondaryNameNode定期将Namenode上的fsimage文件和原编辑日志下载到本地,并在内存中合并,将结果更新到Namenode中,此过程为hdfs的checkpoint机制。从而减少Edit logs文件数,避免Namenode重启时重建耗时过长 <property> <name>dfs.namenode.checkpoint.period</name> <value>3600</value> <description>SecondaryNameNode进行checkpoint的间隔</description> </property >
hadoop NameNode和SecondaryNameNode
最新推荐文章于 2025-09-22 12:41:43 发布
本文详细解析了HDFS中NameNode的角色,包括它如何管理文件系统的元数据和数据块副本的位置信息。同时介绍了SecondaryNameNode的作用,即通过checkpoint机制减少Editlogs文件数量,加快NameNode重启后的重建速度。
部署运行你感兴趣的模型镜像
您可能感兴趣的与本文相关的镜像
Python3.8
Conda
Python
Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本
1070

被折叠的 条评论
为什么被折叠?



