2021SC@SDUSC
这篇分析一下十分重要的workserver类
首先
stop方法
首先调用Stopper.stop设置全局变量。停止所有线程的“死”循环,然后休眠3秒,停止worker心跳。
停止worker任务线程池。停止killExecutor线程池。停止fetchTask线程池。停止zookeeper客户端。
ZKWorkerClient
初始化过程,调用initSystemZNode、listenerWorker、registWorker。
protected void initSystemZNode(){
try {
createNodePath(getMasterZNodeParentPath());
createNodePath(getWorkerZNodeParentPath());
createNodePath(getDeadZNodeParentPath());
} catch (Exception e) {
logger.error("init system znode failed : " + e.getMessage(),e);
}
}
listenerWorker就是监听worker的CHILD_REMOVED事件,监听到该事件之后,调用了checkServerSelfDead。
private void listenerWorker(){
workerPathChildrenCache = new PathChildrenCache(zkClient, getZNodeParentPath(ZKNodeType.WORKER), true, defaultThreadFactory);
try {
workerPathChildrenCache.start();
workerPathChildrenCache.getListenable().addListener(new PathChildrenCac

本文深入探讨了DolphinScheduler的工作服务器停止过程,包括stop方法、ZKWorkerClient和ZKMasterClient的初始化与监听机制,以及故障转移的实现。在故障转移部分,详细介绍了如何处理worker和master的超时情况,以及在连接Zookeeper超时时如何停止心跳、停止任务,并进行状态更新和故障恢复操作。
最低0.47元/天 解锁文章
1204

被折叠的 条评论
为什么被折叠?



