hadoop核心类(五个)
1.hdfs :数据存储
Namenode:org.apache.hadoop.hdfs.server.namendoe.NameNode
DataNode:org.apache.hadoop.hdfs.server.datanode.DataNode
SecondaryNameNode:org.apache.hadoop.hdfs.server.namendoe.SecondaryNameNode
2.yarn :mapreduce作业调度
ResourceManager:org.apache.hadoop.yarn.server.resourcemanager.ResourceManager
NodeManager:org.apache.hadoop.yarn.server.nodemanager.NodeManager
MR job的运行分析
1.client提交mr job
2.rm协调资源分配
3.nm启动并监控container
4.app master协调task
5.app master和task均由rm调度、由nm管理
6.hdfs用于在其他entity间共享job文件
附:web查看状态
http://namenode:50070/ //NN信息
http://datanode:50075/ //DN信息
http://2nd NameNode:50090/ //2ndDN信息
http://yarn-ResourceManager:8088/ //集群信息 (namenode节点ip)
http://yarn-NodeManager:8042/ //NM信息 (datanode节点ip)