Hadoop架构

1.x的版本架构模型介绍

在这里插入图片描述

文件系统核心模块:

NameNode: 集群中的主节点,管理元数据(文件的大小,文件的位置,文件的权限,元数据就是描述数据的数据),主要用于管理集群当中的各种数据。

Secondary NameNode: 主要能用于Hadoop中元数据信息的辅助管理。

DataNode: 集群中的从节点,主要用于存储集群当中的各种数据。

数据计算核心模块:

JobTracker: 接收用户的计算任务,并分配任务给从节点。

TaskTracker: 负责执行主节点JobTracker分配的任务

2.x的版本架构模型介绍(重点)

第一种:NameNode与ResourceManager单节点架构模型
在这里插入图片描述
文件系统核心模块: 同上
数据计算核心模块:
ResourceManager: 接收用户的计算请求任务,并负责集群的资源分配
NodeManager: 负责执行主节点APPmaster分配的任务

第四种:NameNode高可用与ResourceManager高可用架构模型
文件系统核心模块
NameNode: 集群中的主节点,主要用于管理集群当中的各种数据。其中NameNode可以有两个,形成高可用状态。
DataNode: 集群中的从节点,主要用于存储集群当中的各种数据。
JournalNode: 文件系统元数据管理
数据计算核心模块:
ResourceManager: 接收用户的计算请求任务,并负责集群的分配。以及计算任务的划分,通过zookeeper实现ResourceManager的高可用。ResourceManager有两个,形成高可用状态
NodeManager: 负责执行主节点ResourceManager分配的任务。

hadoop 的六个配置文件的作用

core-site.xml: 核心配置文件,主要定义了我们的集群是分布式,还是本机运行
hdfs-site.xml: 分布式文件系统的核心配置 决定了我们数据存放在哪个路径,数据的副本,数据的block块大小等等,linux的磁盘空间的查看 df -lh
hadoop-env.sh 配置我们jdkhome路径
mapred-site.xml 定义了我们关于mapreduce运行的一些参数
yarn-site.xml 定义我们的yarn集群
slaves 定义了我们的从节点是哪些机器datanode nodemanager运行在哪些机器上

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值