《算力网络中高效算力资源度量方法》论文解读与实验复现
论文摘要
- 算力度量的研究处于起步阶段,已有的度量方法相对单一,只考虑了部分静态或动态指标,难以保证算力资源利用率和算力资源匹配准确率。
- 设计了先静后动的混合式度量方法(hybrid metric method, HMM),考虑节点基础性能及动态工作状态的变化;在指标选取上进行了全面考量。
- 实验和数据分析证明能有效提升算力资源利用率和算力资源匹配准确率。
关键词
算力网络(computing-first network)
算力度量(computing resource metric)
论文贡献
- 提出更加综合的度量指标
- 提出混合式算力度量方法,其性能表现更优
研究现状
对于算力度量处于起步阶段,目前研究对于算力度量标准的设计较为单一,大部分单独使用静态指标或动态指标来衡量,容易产生资源利用率低和匹配准确性差等问题。
- 只有静态指标:节点基础性能相近时,哪个拥有的资源更加匹配用户节点
- 只有动态指标:不考虑节点基础性能,算力资源利用率低
传统资源度量技术
CPU性能衡量
CPI = 每条指令的周期 * 每条指令的事件
TOPS、MIPS作为衡量CPU性能的静态指标
GPU性能衡量
与IPC(instructions per cycle)、缓存命中率(cache hit rate)、DRAM利用率、L2利用率等有关
GOPS作为衡量GPU性能的动态指标
除此之外,还有存储等因素
RAM、硬盘存储量作为衡量存储的静态指标
算力资源度量技术

文献1:均为静态指标
文献2-3:只考虑CPU利用率和存储剩余量
方案设计
设计原则
- 全面性:先满足基础性能需求,再考虑动态性能需求
- 综合性:考虑了基础算力、智能算力、存储能力、网络能力四大指标
- 基础算力: TOPS/W、MIPS为静态指标,CPU空闲率为动态指标
- 智能算力:GOPS为静态指标,GPU空闲率为动态指标
- 存储能力:RAM和硬盘存储大小为静态指标,硬盘存储剩余量为动态指标
- 网络能力:吞吐率作为动态指标
- 可操作性:场景案例分析,只考虑动态不满足静态,只考虑静态不满足动态,HMM全部满足

工作流程
- 利用熵权法计算节点的基础性能分数
将TOPS/W、GOPS、MIPS、RAM、硬盘存储大小五个静态因素定义成五元组I = (I1, I2, I3, I4, I5),通过熵权法取得客观的指标权重w = {w1, w2, w3, w4, w5}, 从而得到一个多因素静态联合指标M,M = w1 * I1 + w2 * I2 + w3 * I3 + w4 * I4 + w5 * I5
- 得到节点基础性能分数后,对基础性能进行分段
采用CART算法为排好序的算力节点分数进行分段
- 在确定用户对节点基础性能需求后,分析动态因素
采用n维欧式距离法对动态因素联合分析
- 找出最短距离的节点,即为最优节点

实验评估
- 数据集:收集1000台服务器的算力信息(TOPS/W,GOPS,MIPS,RAM,硬盘存储大小)
- 熵权法得到节点基础性能分数,CART分类,得到静态性能为低、中、高三类节点的数量

- 节点利用率测定,设置1000个节点信息,更改用户任务数量(100,200, … ,1000)

- 节点匹配准确率测定

实验复现
算力度量指标
由于无法找到测定TOPS/W的方式,以及GOPS方式,决定将静态指标变更为:
MIPS(衡量CPU)、GFLOPS(衡量GPU的浮点运算能力)、RAM、硬盘大小
动态指标依然是:CPU利用率、GPU利用率、硬盘剩余量、吞吐率
数据集构造
测定了30台计算机的静态算力信息(来自同学or实验室)

根据静态性能,采用随机数等方式生成30条动态算力信息

本文介绍了一种混合式算力度量方法,针对算力网络中的资源度量问题,通过考虑静态和动态指标的结合,有效提高资源利用率和匹配准确率。方法设计包括全面性原则和工作流程,实验结果显示优于传统单一指标度量。
最低0.47元/天 解锁文章
594

被折叠的 条评论
为什么被折叠?



