- 博客(1)
- 收藏
- 关注
原创 基于Intel SYCL的矩阵乘法
准备阶段:设置矩阵的大小以及block_size的大小,在主机端定义浮点类型容器分别为矩阵A的输入,矩阵B的输入,通过GPU计算后的结果,通过CPU计算后的结果。团队通过学习蔺杰教授有关intel oneAPI的讲解,了解了oneAPI的目标,并行计算的发展现状,intel目前的硬件加速器产品以及sycl的基本编程包括基本流程,实现模式,程序架构,一些基础类。准备阶段:在主机端malloc方法开辟内存空间(输入矩阵A、B和GPU结果矩阵C,CPU结果矩阵C_C),对于两个输入矩阵的计算空间进行随机值赋值。
2023-11-14 17:50:10
252
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人