HDFS
文件系统核心模块:
NameNode:集群当中的主节点,主要用于管理集群当中的各种元数据
secondaryNameNode:主要能用于Hadoop当中元数据信息的辅助管理
DataNode:集群当中的从节点,主要用于存储集群当中的各种数据

MapResource
数据计算核心模块
JobTracker:接收用户的计算请求任务,并分配任务给从节点
TaskTracker:负责执行主节点JobTracker分配的任务

YARN
资源调度核心模块
ResourceManager:Yarn平台的主节点,主要用于接收各种任务,通过两个,构建成高可用
NodeManager:Yarn平台的从节点,主要用于处理ResourceManager分配的任务

本文深入解析了Hadoop生态系统中的三大核心组件:HDFS、MapReduce和YARN。HDFS作为分布式文件系统,由NameNode、secondaryNameNode和DataNode组成,负责数据的存储与管理。MapReduce提供数据计算能力,通过JobTracker分配任务给TaskTracker执行。YARN作为资源调度模块,由ResourceManager和NodeManager协同工作,实现高效的任务调度。

被折叠的 条评论
为什么被折叠?



