Yarn原理与代码实例讲解
文章目录
1.背景介绍
在大数据时代,Apache Hadoop作为一个开源的分布式系统基础架构,被广泛应用于存储和大规模数据处理方面。Hadoop生态圈涵盖了众多优秀的项目,而Yarn(Yet Another Resource Negotiator)作为Hadoop的资源管理和作业调度组件,为整个集群提供了统一的资源管理和使用方式,是确保Hadoop集群高效稳定运行的关键所在。
Yarn的出现是为了解决Hadoop MapReduce V1中存在的一些缺陷,比如只能运行MapReduce作业、资源调度不够灵活等。Yarn将资源管理和作业调度/监控从MapReduce中分离出来,形成一个独立的通用资源管理系统,使得Hadoop可以支持更多种类的分布式应用。
2.核心概念与联系
2.1 Yarn架构
Yarn采用主从架构,主要由资源管理器(Resource Manager)、节点管理器(Node Manager)、应用程序管理器(Application Master)和容器(Container)等组件组成。