读书笔记:Fuxi: a Fault-Tolerant Resource Management and Job Scheduling System at Internet Scale

本文探讨了阿里云伏羲平台作为资源管理和作业调度系统的特点,包括增量资源管理协议、用户透明故障恢复机制及有效的故障节点检测机制。对比YARN,伏羲将任务与容器分离,应用Master直接控制资源生命周期,支持容器复用,采用基于局部性树的调度策略。

    此文是关于阿里云伏羲平台的论文,一些感兴趣的点:

    Fuxi:a resouce management and job scheduling system. (我感觉是基于YARN做的,很像YARN)

        1, An incremental resource management protocol

        2, A user-transparent failure recovery

        3, A  effective (faulty-node) detection mechanism and a mlti-level blacklisting schema

    

    Fuxi (FuxiMaster, AppMaster, Tubo) <>YARN(ResourceManager, AppMaster, NodeManager)

 

    Fuxi 与 YARN区别:

        1,Fuxi seperates the notion of task(the application process  that performs the actual work) and container(the unit of resource grant). Once an application master receives an grant , it explicitly controls its life-cycle and may reuse the container to run multiple tasks.

        2,Lcality tree based scheduling. 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值