hadoop集群搭建

集群介绍

HADOOP集群具体来说包含两个集群:HDFS集群YARN集群,两者逻辑上分离,但物理上常在一起。

HDFS集群负责海量数据的存储,集群中的角色主要有:

NameNode、DataNode、SecondaryNameNode

YARN集群负责海量数据运算时的资源调度,集群中的角色主要有:

ResourceManager、NodeManager

那mapreduce是什么呢?它其实是一个分布式运算编程框架,是应用程序开发包,由用户按照编程规范进行程序开发,后打包运行在HDFS集群上,并且受到YARN集群的资源调度管理。

hadoop架构 

1.x版本

 

 

HDFS

文件系统核心模块:

NameNode:集群当中的主节点,管理元数据(文件的大小,文件的位置,文件的权限),主要用于管理集群当中的各种数据

 

SecondaryNameNode主要能用于hadoop当中元数据信息的辅助管理

DataNode集群当中的从节点,主要用于存储集群当中的各种数据

MapReduce

数据计算核心模块:

JobTracker接收用户的计算请求任务,并分配任务给从节点

TaskTracker负责执行主节点JobTracker分配的任务

2.x版本

 

相比于1.x版本加入了yarn资源调度系统

HDFS

文件系统核心模块:

NameNode:集群当中的主节点,主要用于管理集群当中的各种数据

secondaryNameNode主要能用于hadoop当中元数据信息的辅助管理

DataNode集群当中的从节点,主要用于存储集群当中的各种数据

yarn

数据计算核心模块:

ResourceManager接收用户的计算请求任务,并负责集群的资源分配

NodeManager:负责执行主节点APPmaster分配的任务

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值