Primer View-优快云博客

原创基于Intel SYCL的矩阵乘法

准备阶段：设置矩阵的大小以及block_size的大小，在主机端定义浮点类型容器分别为矩阵A的输入，矩阵B的输入，通过GPU计算后的结果，通过CPU计算后的结果。团队通过学习蔺杰教授有关intel oneAPI的讲解，了解了oneAPI的目标，并行计算的发展现状，intel目前的硬件加速器产品以及sycl的基本编程包括基本流程，实现模式，程序架构，一些基础类。准备阶段：在主机端malloc方法开辟内存空间（输入矩阵A、B和GPU结果矩阵C，CPU结果矩阵C_C），对于两个输入矩阵的计算空间进行随机值赋值。

2023-11-14 17:50:10 386

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 基于Intel SYCL的矩阵乘法

空空如也

空空如也

原创基于Intel SYCL的矩阵乘法