Hadoop MapReduce原理

本文详细介绍了Hadoop的五个核心类:HDFS的Namenode、DataNode、SecondaryNameNode,以及YARN的ResourceManager和NodeManager。阐述了这些组件如何协同工作以实现MapReduce作业的调度和执行,并提供了相关web界面的地址以方便查看各组件的状态。

hadoop核心类(五个)

1.hdfs :数据存储
Namenode:org.apache.hadoop.hdfs.server.namendoe.NameNode
DataNode:org.apache.hadoop.hdfs.server.datanode.DataNode
SecondaryNameNode:org.apache.hadoop.hdfs.server.namendoe.SecondaryNameNode

2.yarn :mapreduce作业调度
ResourceManager:org.apache.hadoop.yarn.server.resourcemanager.ResourceManager
NodeManager:org.apache.hadoop.yarn.server.nodemanager.NodeManager

这里写图片描述

MR job的运行分析

1.client提交mr job
2.rm协调资源分配
3.nm启动并监控container
4.app master协调task
5.app master和task均由rm调度、由nm管理
6.hdfs用于在其他entity间共享job文件

这里写图片描述

附:web查看状态

  http://namenode:50070/    //NN信息
  http://datanode:50075/    //DN信息
  http://2nd NameNode:50090/    //2ndDN信息
  http://yarn-ResourceManager:8088/ //集群信息 (namenode节点ip)
  http://yarn-NodeManager:8042/ //NM信息 (datanode节点ip)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值