在金融行业,数据处理和任务调度是日常运营的重要组成部分。随着业务量的激增,日益增长的任务量和复杂的资源管理需求,要求该系统不仅要稳如磐石,还需灵活高效。

本文将探讨某证券公司在应对这些挑战时所采用的策略,并着重介绍WhaleScheduler如何成为该案例解决方案的关键。
调度系统现状
该证券公司面对的是一个高度挑战性的数据处理环境。他们的系统每天需要处理数百万个任务,这些任务分布在一个由多个Master和众多Worker节点组成的复杂分布式环境中。
- 大规模任务处理:每天处理的任务量在数百万之间,这对调度系统的处理能力和稳定性提出了极高的要求。
- 多节点运行环境:系统使用多个Master和多个Worker进行任务处理,这种分布式环境要求高效的任务分配和协调。
- 服务器资源差异:不同的服务器资源导致任务分发需要特定的配置,增加了系统管理的复杂性。
- 主要任务类型:SQL和Shell任务是主要的任务类型,其中SQL任务占比约70%。
- 大量工作流实例:每天约有10万个工作流实例,任务实例数量在数百万,这要求系统具备高效的工作流管理能力。
- 任务量激增应对:在年终节点或数据上报节点,任务量会激增,此时需要临时增加Master和Worker数量来应对。
- 任务量监控:系统内部设有任务量监控,每天通过邮件发送前一天的任务统计数据,这有助于监控系统性能和处理能力。
面临的挑战
- 高负载下的稳定性:如何在处理日常高达数百万任务的同时,保持系统的稳定性。
- 资源分配的优化:面对不同服务器资源,如何实现任务分配的高效与合理。
- 大量工作流实例的管理

最低0.47元/天 解锁文章
1139

被折叠的 条评论
为什么被折叠?



