HDFS启动过程

最新推荐文章于 2024-03-09 10:00:37 发布

原创最新推荐文章于 2024-03-09 10:00:37 发布 · 2.6k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#namenode #服务器 #hadoop

Hadoop 专栏收录该内容

8 篇文章

订阅专栏

本文详细介绍了HDFS的启动流程及命名节点（namenode）的核心功能，包括其作为集群入口的角色、数据块存储与复制管理、心跳与块报告机制，以及SecondaryNamenode的辅助作用。

部署运行你感兴趣的模型镜像

借鉴地址http://www.linuxidc.com/Linux/2012-01/51614.htm
http://blog.youkuaiyun.com/xh16319/article/details/31375197

要了解hdfs的启动，首先要了解几个概念：
namenode，Secondarynamenode,datanode

namenode

是一个中心服务器，他控制客户端对文件的访问，是一个集群的入口
namenode负责对元数据的操作，并根据集群的情况”决定”将副本放置在某个nodedata上，
namenode管理数据块的复制，每3s接受一次datanode的心跳信号，每1h接收一次daanode的块报告
注意：当超过10min没有接收到心跳报告，则认为该节点死亡，当可用的block过低时，namenode将控制集群变成安全模式(safe mode)
4.namenode命名空间信息，块信息

databode

 1. 以"块(block)"的形式存储数据，1块=128M，datanode由无数的块组成
 2. 向namenode发送“心跳”和“块报告”,及时反馈情况
 3. "在线扩容"或者"下线"
是hdfs整个集群的中心节点，管理整个集群所有的datanode节点，以及客户端对文件的访问，简单来说就是一个入口

_____________

SecondaryNamenode
负责辅助namenode存储数据

在hdfs运行时，SecondaryNameNode会定期的读取NameNode中的fsimage和edit并将两个文件合并成一个新的fsimag.ckbt 然后复制到NameNode中覆盖原有的fsimage加载到内存并产生一个新的为空的edits文件。
这里写图片描述

启动的顺序：

这里写图片描述
在namenoe启动时：
1.读取硬盘中fsimage文件，同时加载到内存中（如果是第一次启动，fsimage是通过初始化形成的空的文件）

2.会创建一个空的edit文件，存放hdfs操作产生新的信息

这个过程主要是防止一个集群打开很长时间运行不重启，而导致edit文件很大，再重启的时候会很慢，甚至重启失败

在之后的启动中，则读取之前最新的fsimage文件

3.datanode将会向namenode进行注册，向namenode发送心跳和块报告

您可能感兴趣的与本文相关的镜像

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本