YARN应用执行与生命周期管理详解
1. YARN应用执行阶段
1.1 应用进度报告
通过应用的跟踪URL可以访问特定的应用监控框架。YARN客户端使用该跟踪URL来监控应用的当前状态,跟踪URL通常包含应用指标。例如,对于MapReduce作业,跟踪URL会显示作业的映射器(mappers)和归约器(reducers)列表。
在任何时间点,YARN客户端都可以向资源管理器(ResourceManager)的应用管理器服务请求应用的状态,资源管理器会以应用报告的形式发送应用状态。
1.2 应用完成
应用完成时,应用主程序(ApplicationMaster)会向资源管理器发送注销请求,然后终止自身并将使用的内存释放回节点管理器(NodeManager)。应用有最终状态和最终状态值,资源管理器会将应用的最终状态标记为“FINISHED”,而最终状态值由应用主程序设置,且特定于所执行的应用。
YARN客户端可以在任何时候向资源管理器发送终止请求来中断应用执行,资源管理器会终止该应用正在运行的容器,并将应用状态更改为已完成。
2. 提交示例MapReduce应用
2.1 向集群提交应用
使用 yarn jar 命令将MapReduce应用提交到Hadoop - YARN集群。Hadoop包中包含一个示例jar,其中包含诸如单词计数、π估计、模式搜索等示例MapReduce程序。命令格式如下:
yarn jar <jarPath> <JobName> <argu
超级会员免费看
订阅专栏 解锁全文
772

被折叠的 条评论
为什么被折叠?



