转自https://blog.youkuaiyun.com/cicada_smile/article/details/109180161
dataNodes跟NameNode关系跟结构如下图

每个DataNode有多个数据块(Block),每个Block有两个文件 1.数据文件 2.元数据文件
DataNode启动后向NameNode注册,然后通过心跳机制(3秒一次)保持通信
DataNode请求NameNode表示自己是正常运行,上报自己的数据块信息,NameNode响应值带有操作DataNode的执行命令,如数据复制或删除
NameNode指定时间内没收到DataNode心跳,就把它当成“不可用”节点
配置文件是hdfs-site.xml
dfs.heartbeat.interval设置心跳时间,单位是秒
上报自己的数据块信息是指
dataNode告诉NameNode,什么文件的第几个block放在它那里,NameNode这个时候会将这些元数据信息写到edit logs文件中。
本文详细介绍了Hadoop中DataNodes与NameNode的关系和交互机制。DataNodes存储数据块并定期向NameNode发送心跳以保持通信,报告其上的文件Block信息。NameNode通过心跳响应来管理DataNodes,包括数据复制和删除指令。当NameNode在指定时间内未收到心跳,会将DataNode标记为不可用。心跳间隔可在hdfs-site.xml配置文件中的dfs.heartbeat.interval参数设置。
1815

被折叠的 条评论
为什么被折叠?



