HDFS是由NameNode、DataNode和SecondaryNameNode组成的。
NameNode:
它是一个管理者,管理着DHFS的命名空间、配置副本策略、数据块的映射信息还有就是处理客户端的读写请求(注意:他只负责处理读写的请求,而不会对数据进行读取的操作)。
DataNode:
这个组件就是用来对数据进行操作的。它负责接收NameNode下达的命令,然后执行实际的操作。也就是对数据的读和写操作。
SecondaryNameNode:
NameNode的辅助,用来分担NameNode的工作量,比如定期合并fsimage和edits文件。在紧急的情况下可以辅助恢复NameNode。