分布式调度

本文深入探讨了分布式调度系统的关键组成部分,包括任务调度和资源调度。对比分析了Hadoop MapReduce、YARN及Mesos等主流分布式调度框架的特点与不足,并详细介绍了阿里云Fuxi系统的设计理念和技术优势。

分布式调度两大任务:

  任务调度:大量计算任务、任务如何切分、数据如何分割、运算、监控运算状态。

  资源调度

1、任务调度

2、资源调度

3、容错机制

4、规模挑战

5、安全与性能隔离

6、分布式调度发展方向

 

一、任务调度

  • 大量计算任务
  • 任务如何切分
  • 数据如何分割、运算
  • 监控节点运行状态

二、资源调度

  • 供给方
  • 不同业务的平衡
  • 优先级抢占

 

 

 

分布式调度系统比较:

hadoop MR:

Job Tracker:资源调度、任务调度

Task Tracker(在Job Tracker注册):任务调度

问题:

1、规模扩展存在瓶颈(每个Task Tracker需要在Job Tracker注册信息,过多Task Tracker占用过多内存)

2、容错性查,Job Tracker单节点没有容错

3、不利于功能扩展,不同任务采用不同调度策略

如何做到不同部门对调度策略的不同要求

如何做到热拔插:在不停止进程运行的情况下,改变系统的调度行为

YARN:比hadoop支持更大规模

将资源调度和资源调度分离:

Resource Manager:资源调度

APP Mstr:任务调度

问题

  1. 只支持内存维度的调度,不能支持CPU、磁盘、网络等维度调度
  2. 资源交互性能

Mesos(伯克利大学)

有一个中心化的资源调度系统,将任务调度从资源调度分离,

问题:

Aliyun-Fuxi:将资源调度和任务调度分离

App Master

Fuxi-Master:类似Resource Manager,负责资源调度

Tubo:每个节点都有,

Package Manager:

用户提交任务给Fuxi Master,Fuxi Master启动App Master,同时App Master向

在VLDB 2014 Fuxi论文

http://www.vldb.org/pvldb/vol7/p1393-zhang.pdf

 

 

任务调度

当数据量增加的时候怎么办?

对海量数据如何并发处理?

分布式调度需要解决的问题

输入数据-->Map(切割)-->中间数据-->Reduce(归约)

 

转载于:https://www.cnblogs.com/jiweilearn/p/8908277.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值