14、数据设计、性能模型与并行算法

数据设计、性能模型与并行算法

1. 压缩稀疏表示的优势

压缩稀疏表示在内存和性能方面都有显著优势。对于以单元为中心的数据结构适用的内核,以单元为中心的压缩稀疏数据结构在内存和运行时间上表现最佳;对于以材料为中心的数据布局的内核,以材料为中心的数据结构略占优势。但总体而言,压缩稀疏表示相较于全矩阵表示有巨大改进。很多处理稀疏数据的应用都能从压缩稀疏数据结构中受益,可通过简单的性能分析判断是否值得为此付出额外努力。

2. 高级性能模型

2.1 模型概述

存在更高级的性能模型能更好地反映计算机硬件特性。在分析带宽受限的内核时,以往按字节和字计数来估算数据移动时间,而计算机硬件的操作单元实际是缓存行,因此可以通过计算需要加载和存储的缓存行来改进性能模型,同时估算缓存行的使用情况。

2.2 流基准测试的问题

流基准测试由复制、缩放、加法和三元组四个内核组成,但各内核带宽存在差异(16156.6 - 22086.5 MB/s)。以往认为是算术强度差异导致,但在带宽受限的情况下,算术运算的小差异影响较小,与算术运算的相关性也不高。缩放操作带宽最低的真正原因是系统缓存层次结构的细节。缓存系统不像流基准测试所暗示的那样像稳定流水的管道,更像图 4.21 所示的桶式接力,不同层次以不同数量和大小的“桶”传递数据。

graph LR
    DRAM(DRAM) --> L3(L3缓存)
    L3 --> L2(L2缓存)
    L2 --> L1(L1缓存)
    L1 --> Registers(寄存器)
   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值