分布式定时任务PowerJob执行流程分析

本文详细介绍了PowerJobv3.4.5的调度机制,包括基本概念如appName和不同类型的Job,如fixedrate/fixeddelay/cron/workflow等。还涵盖了Server和Worker的执行流程、MapReduce原理以及时间轮算法。源码解析部分着重于任务调度、服务发现和Worker节点管理。

powerJob:v3.4.5

一、基本概念

  • appName:应用名称,建议与用户实际接入 PowerJob 的应用名称保持一致,用于业务分组与隔离一个 appName 等于一个业务集群,也就是实际的一个 Java 项目
  • 任务(Job):描述了需要被 PowerJob 调度的任务信息,包括任务名称、调度时间、处理器信息等。
    • frequentJob:
      • FIXED_RATE:固定频率任务,及根据任务的开始时间进行调度
      • FIXED_DELAY:固定延迟任务,及根据任务的结束时间进行调度
    • cronJob:CRON表达式任务
    • workflowJob:工作流任务
  • 任务实例( JobInstance,简称 Instance):任务(Job)被调度执行后会生成任务实例(Instance),任务实例记录了任务的运行时信息(任务与任务实例的关系类似于类与对象的关系)。
  • 作业(Task):任务实例的执行单元,一个 JobInstance 存在至少一个 Task,具体规则如下:
    • 单机任务(STANDALONE):一个 JobInstance 对应一个 Task
    • 广播任务(BROADCAST):一个 JobInstance 对应 N 个 Task,N为集群机器数量,即每一台机器都会生成一个 Task
    • Map/MapReduce任务:一个 JobInstance 对应若干个 Task,由开发者手动 map 产生
  • 工作流(Workflow):由 DAG(有向无环图)描述的一组任务(Job),用于任务编排。
  • 工作流实例(WorkflowInstance):工作流被调度执行后会生成工作流实例,记录了工作流的运行时信息。

二、结构图

三、Server 执行流程分析

四、Worker 执行流程分析

五、MapReduce 原理

六、时间轮算法原理图

七、源码类解析:

服务端(Server):

PowerJob调度中心,负责定时任务的调度、执行结果的存储、客户端状态存储等

  • ServerActor:接收来自Worker的请求
    • 接收来自Worker的心跳上报请求
    • 接收来自Worker的任务实例状态上报请求
    • 接收来自Worker的日志上报请求
    • 接收来自Worker的容器部署请求(接收所有Worker获取容器信息和下载地址的请求)
    • 接收来自Worker master节点的获取所有Worker地址请求
  • FriendActor:接收来自其它Server的请求
    • Worker节点服务注册时,如果负载到了非appId所在server节点,ServerSelectService会对appId所在节点进行Ping请求,以确保节点还存活
    • 管理页面查询Worker列表时,如果负载到了非appId所在server节点,会调用appId所在节点进行FriendQueryWorkerClusterStatusReq请求
    • 管理页面请求任务相关接口时,对加了@DesignateServer注解相关方法进行切面拦截,根据appId找到所在节点并进行转发该次请求
  • OmsScheduleService:任务调度执行服务,每15秒执行一次
    • frequentJob:
      • 负责定时将未运行的任务启动(调用jobService.runJob),并调用JobService开始运行
      • 该类型任务只会由服务端发起一次调度,后续由Worker master节点进行调度
    • cronJob:
      • 找出即将需要执行(小于等于30秒内)的任务
      • 根据nextTriggerTime计算延迟执行秒数,放入时间轮,并异步执行
      • 计算下一次需要调度的时间nextTriggerTime
  • JobService:
    • 负责管理页面上任务的增删改查
    • 负责手动运行和frequentJob的首次运行
  • DispatchService:负责任务的派送(将任务从Server派发到Worker)
    • 获取所有Worker列表中,选择第一个为master节点,并进行任务的发送
客户端(Worker):
  • ServerDiscoveryService:服务发现:客户端向服务端注册本机地址
  • TaskTrackerActor:客户端的master节点,负责接收服务端和子任务的各种请求
    • 负责接收服务端JobInstance发送的调度请求,并创建TaskTracker
    • 负责子任务的管理(状态的接收和子任务请求的接收)
  • TaskTracker:负责处理TaskTrackerActor接收到的各种请求
    • 负责保存任务分片请求和子任务状态到H2数据库
    • FrequentTaskTracker:
      • 负责任务的启动发射(Launcher)
        • FIXED_RATE:根据配置的频率进行周期执行
        • FIXED_DELAY:只进行一次发送,后续Checker检测到完成后,再延迟执行下一次任务
      • 负责定时将H2数据库中的任务进行调度(Dispatcher),每2秒执行一次
      • 负责定时进行状态的检测(Checker),每5-15秒执行一次

我司对该源码参数进行了修改,将5s改成100ms,即100ms-15s执行一次,不然可能造成间隔5秒以内执行的任务完成时间大于预期

     - 如果检测到所有子任务已完成,则下发lastTask进行Reduce
     - 如果检测到lastTask已完成,则认为所有任务完成
     - 如果是FIXED_DELAY任务,则会延迟调度下一次任务
  - 负责新Worker上线的检测(WorkerDetector),每1分钟执行一次,并将新Worker地址加入到ProcessorTrackerStatusHolder中
  • CommonTaskTracker:
    • 将root任务存储到H2数据库中
    • 负责定时进行状态检测(StatusCheckRunnable),默认每3秒执行一次
    • 负责新Worker上线的检测(WorkerDetector),每1分钟执行一次,并将新Worker地址加入到ProcessorTrackerStatusHolder中
    • 负责定时将H2数据库中的任务进行调度(Dispatcher),每2秒执行一次
  • ProcessorTrackerActor:客户端的子节点,负责接收子任务执行请求和停止请求
  • ProcessorTracker:负责子任务的执行和停止
    • 定时向 TaskTracker 汇报(携带任务执行信息的心跳)
    • 子任务线程池的管理
    • 子任务的异步执行ProcessorRunnable
  • ProcessorTrackerStatusHolder:负责Worker子节点ProcessorTracker状态(地址)的管理
  • 自定义MapProcessor子类:真正编写分片逻辑和任务执行代码的地方
  • OmsContainerFactory:从Server获取java容器信息和下载容器

八、参考文章:

较真儿学源码系列-PowerJob时间轮源码分析-优快云博客
PowerJob官方文档:架构与原理

PowerJob是全新一代分布式调度与计算框架,支持CRON、API、固定频率、固定延迟等调度策略,提供工作流来编排任务解决依赖关系,使用简单,功能强大,文档齐全,能让您轻松完成作业的调度与繁杂任务的分布式计算。 PowerJob特点: 使用简单:提供前端Web界面,允许开发者可视化地完成调度任务的管理(增、删、改、查)、任务运行状态监控和运行日志查看等功能。 定时策略完善:支持CRON表达式、固定频率、固定延迟和API四种定时调度策略。 执行模式丰富:支持单机、广播、Map、MapReduce四种执行模式,其中Map/MapReduce处理器能使开发者寥寥数行代码便获得集群分布式计算的能力。 DAG工作流支持:支持在线配置任务依赖关系,可视化得对任务进行编排,同时还支持上下游任务间的数据传递 执行器支持广泛:支持Spring Bean、内置/外置Java类、Shell、Python等处理器,应用范围广。 运维便捷:支持在线日志功能,执行器产生的日志可以在前端控制台页面实时显示,降低debug成本,极大地提高开发效率。 依赖精简:最小仅依赖关系型数据库(MySQL/Oracle/MS SQLServer...),扩展依赖为MongoDB(用于存储庞大的在线日志)。 高可用&高性能:调度服务器经过精心设计,一改其他调度框架基于数据库锁的策略,实现了无锁化调度。部署多个调度服务器可以同时实现高可用和性能的提升(支持无限的水平扩展)。 故障转移与恢复:任务执行失败后,可根据配置的重试策略完成重试,只要执行器集群有足够的计算节点,任务就能顺利完成。 PowerJob适用场景: 有定时执行需求的业务场景:如每天凌晨全量同步数据、生成业务报表等。 有需要全部机器一同执行的业务场景:如使用广播执行模式清理集群日志。 有需要分布式处理的业务场景:比如需要更新一大批数据,单机执行耗时非常长,可以使用Map/MapReduce处理器完成任务的分发,调动整个集群加速计算。 有需要延迟执行某些任务的业务场景:比如订单过期处理等。     PowerJob 更新日志: v4.0.1 Features 支持 PostgreSQL 强化前端控制台,新增 tag、上次在线时间等 worker 信息,便于排查无法连接的问题。 BugFix 修复 server 集群选主问题 修复当没有 worker 连接到 server 时出现的 NPE 问题 修复前端控制台错误显示 worker 列表的问题
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值