HDFS集群有两类节点,并以管理者-工作者模式运行,即一个NameNode(管理者)和多个DataNode(工作者)。
一、NameNode(NN)
——基于内存存储 :不会和磁盘发生交换
·只存在内存中
·持久化
——NameNode主要功能
·接受客户端的读写服务
·收集DataNode汇报的Block列表信息
——NameNode保存metadata信息包括
·文件owership和permissions
·文件大小,时间
·(Block列表:Block偏移量),位置信息
·Block每副本位置(由DataNode上报)
二、NameNode持久化
——NameNode的metadate信息在启动后会加载到内存
——metadata存储到磁盘文件名为”fsimage”
——Block的位置信息不会保存到fsimage
——edits记录对metadata的操作日志。。。redis