14、折叠与TAU性能系统的技术进展

折叠与TAU性能系统的技术进展

1. 折叠:粗采样的详细分析

在性能分析中,折叠机制结合粗采样是一种有效的方法。下面是相关实验设置的详细信息:
| 应用执行设置 | 详细采样 | 粗采样 |
| — | — | — |
| 应用名称 | BT.B | BT.B |
| 采样模式 | 详细 | 粗 |
| 采样周期 | 50 Kcycles | 10 Mcycles |
| 每秒样本数 | 32,000 | 160 |
| 采样开销 | 89 % | 2 % |
| 迭代次数 | 1 | 200 |
| 每个任务的总样本数 | 5,661 | 5,445 |

为了提高数据访问的局部性,对循环进行了一些优化尝试。例如,尝试减少循环内的数组访问次数,当前循环中有11个数组被访问。还对第三个循环应用了分块和拆分技术,但分块大小为128个元素时,Cluster 1变慢了3%,拆分循环则使Cluster 1变慢了20%,主要原因是TLB缺失增加。

1.1 结果验证

使用NAS MPI并行基准套件3.2中的BT.B基准测试,在配备1.6 GHz英特尔安腾2处理器的SGI Altix机器上验证和研究折叠机制的质量。虽然该基准测试经过了大量优化,但部分计算区域表现出不均匀的行为,适合用于研究。折叠机制中使用的克里金插值算法类似于低通滤波器,插值的样本越多,插值结果越详细。

实验主要分为两个部分:
- 第一部分 :比较高频采样轨迹和低频折叠采样轨迹中硬件计数器指标的形状。选取基准测试中两个最耗时的计算区域,将高频轨迹的一

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值