大数据存储与处理——YARN

YARN(Yet Another Resource Negotiator)是为了改进Hadoop MapReduce v1的局限性而诞生的,它提供了统一的资源管理框架,支持多种计算框架如MapReduce、Tez、Storm和Spark。YARN的结构包括ResourceManager、NodeManager和ApplicationMaster,其中ResourceManager全局调度资源,NodeManager管理节点资源,ApplicationMaster负责应用的调度和监控。YARN还具备容错机制,如ResourceManager的高可用性和ApplicationMaster的自动重启。此外,YARN采用双层调度框架和资源预留策略来优化集群资源利用率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Yarn产生的原因

在这里插入图片描述
直接源于MRv1在几个方面的缺陷
扩展性受限
单点故障:JobTracker 完成了太多的任务,造成了过多的资源消耗
难以支持MR之外的计算

多计算框架各自为战,数据共享困难

在这里插入图片描述

YARN

即在一个集群上部署一个统一的资源调度管理框架YARN,在YARN之上可以部署其他各种计算框架
由YARN为这些计算框架提供统一的资源调度管理服务,并且能够根据各种计算框架的负载需求,调整各自占用的资源,实现集群资源共享和资源弹性收缩

离线计算框架:MapReduce
DAG计算框架:Tez 有向无环图 适合编写有依赖关系的作业
流式计算框架:Storm
内存计算框架:Spark【不读磁盘而直接在内存上计算】
图计算框架:Giraph

YARN的结构

ResourceManager:整个集群只有一个,负责集群资源的统一管理和调度
NodeManager:单个节点上的资源管理
ApplicationMaster:每个应用有一个,任务调度、监控与容错

ResourceManager(RM)是一个全局的资源管理器,负责整个系统的资源管理和分配,主要包括两个组件,即调度器(Scheduler)和应用程序管理器(Applications Manager)

调度器接收来自ApplicationMaster的应用程序资源请求,把集群中的资源以“容器”的形式分配给提出申

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值