Tomato
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
25、GLUME:批量调度平台上的工作流调度策略
本文介绍了一种新的批量调度平台上的工作流调度算法 GLUME(Group Levels Using Makespan Estimates),并与其他现有算法如 Zhang、OneJob、OneJobPerTask 和 LevelByLevel 进行比较。GLUME 通过明确优化工作流的完成时间,在大多数实验中表现出优于其他算法的能力,尤其适用于中等和长工作流场景。文章还分析了 GLUME 的优势与局限性,并提供了在不同工作负载下的实际应用建议以及未来研究方向。原创 2025-07-15 12:48:41 · 49 阅读 · 0 评论 -
24、批调度平台上的工作流调度策略解析
本文深入解析了在批调度平台上执行工作流时的调度策略,重点分析了Zhang算法及其与其他策略(如OneJobPerTask、OneJob和LevelByLevel)在不同场景下的表现。通过实验评估和实际应用建议,帮助用户根据工作流特点和平台负载情况选择最优调度策略,以最小化总完成时间并提升执行效率。原创 2025-07-14 09:51:31 · 52 阅读 · 0 评论 -
23、可变容量资源调度与工作流调度策略解析
本文探讨了可变容量资源调度与工作流调度的核心挑战及解决方案。重点分析了资源容量受外部因素影响所带来的调度难题,并介绍了如何通过智能调度策略提升性能和资源利用率。同时,文章提出了一种新的工作流调度策略GLUME,旨在优化批处理平台上的科学工作流执行效率。研究表明,智能调度能够显著缓解资源可变性带来的负面影响,并为未来复杂计算环境的资源管理提供新思路。原创 2025-07-13 11:39:11 · 42 阅读 · 0 评论 -
22、可变容量资源调度挑战解析
本文探讨了数据中心和集群环境中资源容量可变性带来的作业调度挑战。传统的调度器通常假设资源容量恒定,而现实中资源会因价格、碳排放、闲置电力等因素动态变化,导致有效吞吐量显著下降。文章分析了问题定义、调度挑战、影响因素及改进策略,并通过实验评估了不同工作负载和调度策略的性能表现,提出了应对资源调度挑战的建议,如采用智能调度策略、实时监控调整等方法以提升系统效率和稳定性。原创 2025-07-12 11:55:26 · 38 阅读 · 0 评论 -
21、二维网格上并行任务的温度感知调度与可变容量资源调度挑战
本文探讨了二维网格上并行任务的温度感知调度与可变容量资源调度所面临的挑战。在温度感知调度方面,通过引入伙伴核心概念和使用不同的热行为建模方式,研究了其对能源效率和系统可行性的影响,并提出了基于启发式算法的替代调度方法。同时,分析了可变容量资源调度问题,讨论了由于电力限制、碳排放管理及其他外部因素导致的资源动态变化给调度带来的影响,并提出了应对策略,如基于预测的调度、弹性资源分配和智能调度算法的应用。实验结果表明,这些新方法能够有效提升系统性能和资源利用率,为未来的研究提供了方向。原创 2025-07-11 09:12:03 · 55 阅读 · 0 评论 -
20、二维网格上并行任务的温度感知调度
本文探讨了在二维网格上进行并行任务的温度感知调度方法,重点分析了稳态调度和皇冠调度技术,并提出了带伙伴机制的温度感知调度策略。通过固定伙伴核心和任意伙伴的ILP模型,实现对高发热任务的热管理,同时优化能耗和性能。适用于嵌入式系统和高性能计算环境下的任务调度优化。原创 2025-07-10 16:11:54 · 51 阅读 · 0 评论 -
19、基于二维网格多核CPU的温度感知可塑流任务能量优化调度
本文研究了在具有二维网格结构的多核CPU上,针对多变体可塑流任务的温度感知和能量最优调度问题。通过扩展Crown调度技术,并引入伙伴核心技术,提出了两种基于整数线性规划(ILP)的解决方案以及一种快速启发式方法,旨在避免局部热点、提高调度灵活性并优化能耗。实验结果表明,所提方法在截止时间紧张或DVFS级别受限的情况下仍能有效找到可行调度方案,并显著降低能耗。原创 2025-07-09 09:42:12 · 49 阅读 · 0 评论 -
18、可塑科学工作流的性能 - 成本优化
本文探讨了可塑科学工作流的性能与成本优化策略,重点分析了局部优化和全局优化方法的效果及适用场景。通过遗传算法,研究了不同工作流规模和参数设置下的调度策略,并引入α参数在执行时间和成本之间进行权衡。实验结果显示,局部优化在较短时间内能找到最优解,而全局优化能够在复杂场景下实现较好的平衡。文章还总结了不同优化方法的计算需求,并展望了未来的研究方向,如α参数的改进、标准任务图验证、算法优化以及实际任务数据的处理。原创 2025-07-08 15:08:20 · 47 阅读 · 0 评论 -
17、可塑科学工作流的性能 - 成本优化
本文探讨了使用遗传算法自动优化可塑科学工作流的执行参数,以实现性能与成本的最佳平衡。文章介绍了三种适应度函数,分别适用于局部优化、按需分配的全局优化和静态分配的全局优化场景,并开发了集群模拟器 Tetrisator 来评估工作流的执行计划。实验结果表明,遗传算法能够有效优化不同规模的工作流,在执行时间与计算成本之间实现灵活权衡,为未来科学计算中的资源调度提供了新思路。原创 2025-07-07 13:37:09 · 52 阅读 · 0 评论 -
16、基于强化学习的高性能计算协同调度器ASAX
本文介绍了基于强化学习的高性能计算协同调度器ASAX,该调度器结合应用程序分析和决策树专家,有效提高了资源利用率和集群吞吐量。通过对比实验验证了ASAX在不同集群规模和负载下的优越性能,包括减少作业响应时间、适应现代动态工作流以及控制资源共享带来的性能下降。文章还分析了ASAX的工作流程、收敛性证明及其在未来高性能计算场景中的应用与展望。原创 2025-07-06 14:33:22 · 56 阅读 · 0 评论 -
15、基于强化学习的高性能计算协同调度器ASAX解析
ASAX是一种基于强化学习和决策树的新型高性能计算(HPC)协同调度器,旨在提高集群资源利用率和作业执行效率。通过引入概率策略、动态调整CPU配额以及利用幸福度指标评估作业状态,ASAX能够智能地优化协同调度决策。实验结果表明,与传统调度器Slurm及静态分配策略相比,ASAX在减少工作负载的makespan、提升CPU利用率和降低队列等待时间方面表现出显著优势。尽管存在一定的学习成本和系统复杂性挑战,ASAX为未来HPC调度提供了更智能和高效的解决方案。原创 2025-07-05 11:01:20 · 56 阅读 · 0 评论 -
14、基于学习的方法估算HTC数据中心作业等待时间及HPC协同调度算法
本文探讨了基于机器学习方法对HTC数据中心作业等待时间的估算,以及基于强化学习的HPC协同调度算法。通过分析法国IN2P3计算中心的数据,研究人员使用决策树回归器实现了高效的作业等待时间预测,并设计了一种能够动态适应环境变化的强化学习调度算法,有效提高了集群资源利用率和服务质量。文章还提供了相关代码示例及优化建议,为未来研究与应用提供了参考方向。原创 2025-07-04 15:48:05 · 79 阅读 · 0 评论 -
13、基于学习的方法估计HTC数据中心作业等待时间
本文探讨了基于机器学习的方法来估计数据中心作业的等待时间,涵盖了线性回归、决策树回归和集成学习方法(如AdaBoost和Bagging)的应用与实验评估。通过在CC-IN2P3计算中心的真实数据集上进行测试,并对KIT FH2工作负载进行扩展分析,研究表明决策树回归器(深度7)在回归问题中表现最佳,而先进行回归再分类的方法在分类任务中更具有优势。文章还讨论了这些方法在不同计算环境和工作负载下的适用性与调整策略,总结了一套通用的操作步骤,为未来研究和实际应用提供了参考框架。原创 2025-07-03 10:13:17 · 48 阅读 · 0 评论 -
12、基于学习的HTC数据中心作业等待时间估计
本文探讨了在HTC(High Throughput Computing)数据中心中,如何通过基于学习的方法准确估计作业等待时间。文章分析了影响作业等待时间的因素,包括提交时间段、队列状态、份额消耗、配额限制等,并通过相关性分析和特征处理筛选出关键特征。随后利用机器学习算法构建预测模型,对作业等待时间进行估计,以帮助用户优化作业提交策略并提高资源利用率。原创 2025-07-02 09:13:00 · 53 阅读 · 0 评论 -
11、大型核心机器上的微服务容器调度与HTC数据中心作业等待时间估计
本文探讨了在大型核心机器上的微服务容器调度优化方法与高通量计算(HTC)数据中心作业等待时间估计的研究。针对微服务容器调度,提出了一种基于容器通信负载的合并算法,并结合TRACPAD调度器有效减少了网络传输数据量并提升了性能。对于HTC数据中心,分析了作业等待时间分布及其影响因素,并提出了基于机器学习的回归估计器和范围分类器来预测等待时间,为用户提供更可靠的时间参考。研究成果可应用于大规模数据中心优化服务质量,并为进一步研究自动化容器调度和安全性策略提供基础。原创 2025-07-01 15:59:52 · 39 阅读 · 0 评论 -
10、大型核心机器上微服务容器调度:TRACPAD 方法解析
本文介绍了 TRACPAD 方法在大型核心机器上对微服务容器进行高效调度的实现。TRACPAD 通过双标准近似图分区算法对容器进行合理分区,结合网络流量监控和动态资源分配,显著提高了应用吞吐量并降低了延迟。文章还探讨了影响调度策略的关键因素,如数据库大小和请求数据包大小,并引入了容器合并技术以进一步减少通信开销。实验结果表明,TRACPAD 在多个微服务基准测试中均取得了良好的性能提升效果。原创 2025-06-30 12:45:25 · 43 阅读 · 0 评论 -
9、超量调度与微服务容器调度技术解析
本文深入解析了超量调度与微服务容器调度技术,重点探讨了超量调度的性能测量与预测模型,以及TRACPAD调度器在微服务容器调度中的实现与实验评估。文章详细分析了影响调度策略的关键因素,并通过实验验证了TRACPAD调度器在提升吞吐量和降低延迟方面的显著优势。原创 2025-06-29 13:50:09 · 44 阅读 · 0 评论 -
8、超量使用调度系统的测量、建模与性能评估
本文探讨了超量使用调度系统在超算环境中的测量、建模与性能评估方法。通过定义性能降解率,对批处理作业与交互式作业在超量使用情况下的性能变化进行了详细分析。研究展示了如何利用性能监控计数器(PMCs)构建两阶段模型,以预测作业对的匹配情况,从而提高资源利用率。同时,文章分析了模型的误判情况,并提出了优化建议,如改进聚类算法、引入更多性能指标和实时性能监测。最后,通过实际应用案例验证了超量使用调度系统在资源利用率和作业执行效率方面的显著提升效果。原创 2025-06-28 10:35:11 · 56 阅读 · 0 评论 -
7、超算系统中的模块化工作负载格式与过度承诺调度
本文介绍了超算系统中模块化工作负载格式(MWF)的设计与优势,以及应对交互式作业需求增长的过度承诺调度策略。MWF提供了对复杂资源请求和动态工作流的支持,而过度承诺调度则通过共享计算资源来提高系统利用率和响应速度。文章还探讨了不同级别的过度承诺、相关性能退化问题及其预测模型,并提出了未来优化方向。原创 2025-06-27 09:14:49 · 47 阅读 · 0 评论 -
6、模块化工作负载格式:扩展 SWF 以适应模块化系统
本文探讨了标准工作负载格式(SWF)的局限性,并提出了模块化工作负载格式(MWF)作为扩展解决方案,以适应现代异构系统和复杂的作业需求。MWF支持多组件作业、资源动态请求以及组件间依赖关系,提升了系统的灵活性与效率。通过详细的字段定义和丰富的用例分析,MWF展示了其在处理单步作业、多步作业、异构步骤作业及复杂工作流方面的强大能力,为未来高效系统设计提供了重要支持。原创 2025-06-26 15:54:46 · 83 阅读 · 0 评论 -
5、HPC作业调度预测方法与模块化工作负载格式解析
本文探讨了高性能计算(HPC)领域中的作业调度预测方法与模块化工作负载格式(MWF)。文章概述了依赖专家和自动化机器学习的预测方法,并介绍了预测所需的数据条件、常用指标以及开源存储库。同时,提出了MWF作为SWF的扩展格式,适应现代异构系统和复杂作业的需求。最后,分析了作业调度预测的应用场景、挑战及未来发展趋势,包括自动化智能化、多维度数据融合以及标准化开放共享。原创 2025-06-25 09:00:03 · 52 阅读 · 0 评论 -
4、带反馈的重采样与HPC作业调度预测方法
本文探讨了计算机系统性能评估和HPC作业调度领域的两个重要研究方向:带反馈的重采样技术和作业墙时间预测方法。带反馈的重采样技术能够生成更真实、动态的工作负载,用于模拟评估系统的性能,并显著影响吞吐量和用户满意度等关键指标。同时,HPC作业调度预测方法则聚焦于提高作业墙时间估计的准确性,涵盖了从传统方法到现代机器学习和深度学习的应用。文章还讨论了两种技术之间的关联以及未来的研究方向与挑战,并通过实际应用案例展示了它们在提升系统性能和资源利用效率方面的显著效果。原创 2025-06-24 13:38:05 · 49 阅读 · 0 评论 -
3、带反馈的重采样:优化工作负载模拟的新方法
本文介绍了一种优化计算机系统性能评估的新方法——带反馈的重采样工作负载模拟。通过结合日志数据和用户行为建模,该方法不仅解决了传统日志驱动模拟的局限性,还引入了动态反馈机制以更真实地反映用户与系统的交互。文章详细阐述了重采样的起源、实现过程以及反馈机制的设计,并探讨了其在验证模拟结果、增强模拟效果、吞吐量评估和用户感知调度器设计等方面的应用价值。原创 2025-06-23 14:40:20 · 45 阅读 · 0 评论 -
2、并行作业工作负载模拟:日志、模型与重采样的权衡
本文探讨了在并行作业工作负载模拟中使用日志、模型以及结合两者的重采样与反馈方法。比较了直接使用日志和创建模型各自的优劣,详细介绍了重采样与反馈的实现步骤及其优势。旨在为系统设计与性能评估提供更可靠的工作负载模拟方法。原创 2025-06-22 13:31:33 · 36 阅读 · 0 评论 -
1、2021 JSSPP 研讨会:并行作业调度的前沿探索
本文介绍了2021年JSSPP研讨会的前沿研究成果,涵盖并行作业调度领域的多个关键主题。研讨会讨论了带反馈的重采样方法在工作负载数据中的应用、开放调度问题中的数据格式改进以及多项技术论文成果,包括基于强化学习的HPC协同调度器、可塑科学工作流的性能-成本优化、温度感知的能量优化调度等。这些研究为未来资源管理和调度优化提供了新思路,并推动了并行处理作业调度技术的发展。原创 2025-06-21 11:00:55 · 91 阅读 · 0 评论
分享