Hadoop状态转移图生成

最新推荐文章于 2024-09-20 14:26:57 发布

原创最新推荐文章于 2024-09-20 14:26:57 发布 · 1.8k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#hadoop

HADOOP 专栏收录该内容

10 篇文章

订阅专栏

本文深入探讨了状态转移与事件驱动在确保大型系统顺利推进方面的重要作用。详细介绍了状态转移图的生成方法及其实用性，如在讨论功能、UT测试和Hadoop应用中的使用。通过实例展示了生成状态转移图的具体步骤和效果，以及它们在MapReduce、NodeManager和ResourceManager中的实际应用。

事件驱动和状态转移，在很大程度上保证了大型系统的顺利推进。状态转移有如下好处：

状态转移图是可以生成的。在讨论某个功能的时候，可以直接对着图进行讨论
某个状态转移图里面，通过加锁、生产者/消费者模式等方法，可以保证一个时间点只有一个状态转移，进而保证状态的正确性
在进行UT（单元测试）的时候，只需要对每一条转移路径进行测试就好啦

Hadoop也大量采用了这种方法，如MapReduce的状态转移，NM和RM中资源、任务的管理．

生成方法

hadoop内部的状态转移图，是可以通过程序生成的。方法：使用类VisualizeStateMachine，在运行的时候指定三个参数：图的名字、包含事件转移的类（类之间通过”,”隔开）、生成的文件名(.gv格式)，如

$ hadoop org.apache.hadoop.yarn.state.VisualizeStateMachine TaskStateChange org.apache.hadoop.mapreduce.v2.app.job.impl.TaskImpl TaskImpl.gv

生成的图如下
TaskImpl

hadoop所有的状态转移图生成方法

mvn命令生成

参考MAPREDUCE-2930

$mvn -Pvisualize compile
$dot -Tpng NodeManager.gv > NodeManager.png; dot -Tpng ResourceManager.gv > ResourceManager.png; dot -Tpng MapReduce.gv > MapReduce.png;

通过VisualizeStateMachine生成

hadoop中使用状态转移的大致有三类：MapReduce、NodeManager、ResourceManager，下面将给出生成这三大类转移图的脚本

MapReduce相关

hadoop org.apache.hadoop.yarn.state.VisualizeStateMachine MapReduce org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl,org.apache.hadoop.mapreduce.v2.app.job.impl.TaskImpl,org.apache.hadoop.mapreduce.v2.app.job.impl.TaskAttemptImpl MapReduce.gv

NodeManager相关

hadoop org.apache.hadoop.yarn.state.VisualizeStateMachine NodeManager org.apache.hadoop.yarn.server.nodemanager.containermanager.application.ApplicationImpl,org.apache.hadoop.yarn.server.nodemanager.containermanager.container.ContainerImpl,org.apache.hadoop.yarn.server.nodemanager.containermanager.localizer.LocalizedResource NodeManager.gv

ResourceManager相关

hadoop org.apache.hadoop.yarn.state.VisualizeStateMachine ResourceManager org.apache.hadoop.yarn.server.resourcemanager.rmapp.attempt.RMAppAttemptImpl,org.apache.hadoop.yarn.server.resourcemanager.rmapp.RMAppImpl,org.apache.hadoop.yarn.server.resourcemanager.rmcontainer.RMContainerImpl,org.apache.hadoop.yarn.server.resourcemanager.rmnode.RMNodeImpl ResourceManager.gv