1. HDFS集群分为两大角色:NameNode、DataNode (Secondary Namenode)
2. NameNode负责管理整个文件系统的元数据
3. DataNode 负责管理用户的文件数据块
4. 文件会按照固定的大小(blocksize)切成若干块后分布式存储在若干台datanode上
5. 每一个文件块可以有多个副本,并存放在不同的datanode上
6. Datanode会定期向Namenode
HDFS由NameNode和DataNode组成,NameNode管理元数据,DataNode存储文件块。文件按blocksize切分,每个block有多份副本分散在不同节点。客户端通过与NameNode交互进行文件读写,DataNode定期报告文件block信息。HDFS写数据涉及NameNode、Client和DataNode间的RPC通信,建立pipeline传输block。读数据时,Client从NameNode获取文件位置,选择DataNode建立连接并接收数据。
1. HDFS集群分为两大角色:NameNode、DataNode (Secondary Namenode)
2. NameNode负责管理整个文件系统的元数据
3. DataNode 负责管理用户的文件数据块
4. 文件会按照固定的大小(blocksize)切成若干块后分布式存储在若干台datanode上
5. 每一个文件块可以有多个副本,并存放在不同的datanode上
6. Datanode会定期向Namenode
3237

被折叠的 条评论
为什么被折叠?
