大数据入门6：Hadoop资源管理-YARN

最新推荐文章于 2025-02-12 10:29:26 发布

原创最新推荐文章于 2025-02-12 10:29:26 发布 · 383 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

大数据入门专栏收录该内容

10 篇文章

订阅专栏

YARN作为Hadoop的资源管理系统，解决了早期版本资源管理不足的问题，通过引入ResourceManager和NodeManager等组件，实现了资源的高效分配和利用。YARN不仅支持Hadoop的MapReduce，还兼容如Spark、Storm等大数据处理框架，提升了资源利用率，降低了数据移动需求，促进了Hadoop生态系统的繁荣。

文章目录

YARN：Hadoop资源管理

YARN：Hadoop资源管理

1. 介绍

早期1.0的hadoop没有资源管理，导致各种工具使用不方便，没有集合

在HDFS和应用层之间加入YARN层，可以构建新的系统，集中不同类型的大数据应用程序，如用于图形数据分析的Giraph、用于流式数据分析的Storm和用于内存分析的Spark。 YARN提供了一个标准的框架 ，支持定制化的应用建立在HADOOP生态之下。

在这里插入图片描述

2. 结构

Node Manager：每一个机器都有一个Node Manager，它在单个机器层面上工作，控制着独立的机器
Application Master：谈判者（personal negotiator），与Resource Manager ”谈判“获得资源，并在任务结束之后通知Node Manager
Container：是一个抽象概念，代表的是CPU,内存硬盘网络（memory disk network）等等其他资源的集合，简单一点可以把它理解成为机器（电脑）
Resource Manager：中间的Resource Manager是终极决策者，它控制着所有的资源，决定了谁分配到啥
Data Computation Framework =Node Manager+ Resource Manager

3. 总结

YARN为应用程序提供了许多从数据中提取价值的方法
允许在相同的hadoop集群上运行多种分布式应用程序
减少了数据的移动需求，并支持更高的资源利用率，降低了成本
是一个可扩展的平台，使得在HDFS上的应用蓬勃发展，大大的丰富了Hadoop的生态系统

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。