代码性能优化——分块技巧
代码性能优化——分块技巧同样的算法、同样的计算量,一些高手写的程序可能比初学者的快百倍。像MKL、Openblas这些专业的计算库,更是将性能优化到了极致。那么他们是怎么做到的呢?本篇我们就从分块技巧开始来管中窥豹一下。代码实例开门见山,以一个实用的程序作为例子:向量乘矩阵如图所示,M个元素的向量乘以M行N列的矩阵,生成N个元素的向量。基本代码如下:#define M (2048)#define N (1024)static void naive(float vec_in[M], fl
原创
2020-12-30 00:09:45 ·
1831 阅读 ·
2 评论