分布式计算hadoop三大组件

本文深入解析Hadoop架构,包括移动计算而非数据的设计原则,详细介绍了Map/Reduce计算层、YARN调度层及HDFS数据层的功能与独立性,阐述了各组件如ResourceManager、NodeManager、NameNode和DataNode的部署策略及它们之间的交互过程。

设计原则:移动计算,而不是移动数据

计算层:Map/Reduce
调度层:YARN
数据层:HDFS

这三层之间没有必然的依赖性,只是经常这么搭配,而且都是hadoop那个包里一起安装的,三层都可以独立运行,某一层或者某两层换成其他的而另外两层或者一层不换也是可以的


YARN 调度系统
  ResourceManager
  NodeManager
HDFS 存放数据
  NameNode
  DataNode

当有一个计算任务到来的时候,首先访问YARN的ResourceManager然后将计算分发给一个或多个NodeManager,由NoadManager执行真正的计算


YARN和HDFS都是主从结构,都是为大数据处理来服务的

通常情况下:

YARN的NodeManage和HDFS的DataNode分别部署在同一台机器上(计算和数据在同一台机子上)

YARN的ResourceManager和HDFS的NameNode通常会各自占用一台机器(因为两个都很废内存)

但这并不是必须的,

ResourceManager可以和NameNode可以在同一台机器上

NodeManager也可以和DataNode也可以在不同的机器上

 

YARN和HDFS在逻辑上是独立的,可以相互配合也可以独立使用,各自都可以单独启动,只不过他们两个都在Hadoop下

转载于:https://www.cnblogs.com/413xiaol/p/9961007.html

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值