
FORTRAN
xll_bit
这个作者很懒,什么都没留下…
展开
-
【CUDA-FORTRAN] 1D stencil
module reverse_m implicit none integer, device :: n_d contains attributes(global) subroutine staticReverse(a, d) real :: d(:), a(:), result integer :: t, tr, t1, j, sa integer,parameter :: ra = 3 real, shared :: s(-ra+1:64 + ra) .原创 2021-06-04 10:46:36 · 491 阅读 · 3 评论 -
【CUDA-FORTRAN】实现任意维度矩阵乘
之前写过一篇矩阵乘,但只能是方阵,详见https://blog.youkuaiyun.com/xll_bit/article/details/103271788?spm=1001.2014.3001.5501 这次原创 2021-06-04 10:29:55 · 727 阅读 · 0 评论 -
【CUDA】矩阵乘法(从简单到进阶)
在学习CUDA的过程中,免不了要实现矩阵乘,从而对GPU的运作机制以及如何使用share memory有更深的理解。下面是用FORTRAN对简单矩阵乘和利用分块并将数据放入share memory实现矩阵乘的实现。 ! this program demonstates various memory optimzation techniques ! applied to a matrix mul...原创 2019-11-27 11:20:57 · 693 阅读 · 0 评论 -
【FORTRAN+MPI】二维笛卡尔坐标应用(虚拟拓扑)
当进行矩阵乘法时,往往需要将节点映射为二维网格,就会用到笛卡尔坐标。本文展示了基于Fortran的MPI_CART的用法,以及相邻坐标之间的通信。 program cartesian include 'mpif.h' integer SIZE, UP, DOWN, LEFT, RIGHT parameter(SIZE=16) ...原创 2019-11-13 12:23:13 · 1641 阅读 · 0 评论