【矩阵计算GPU加速】numpy 矩阵计算利用GPU加速，cupy包

最新推荐文章于 2024-09-22 15:50:52 发布

原创最新推荐文章于 2024-09-22 15:50:52 发布 · 1.6w 阅读

36 ·

CC 4.0 BY-SA版权

文章标签：

#矩阵计算GPU加速 #cupy

python 专栏收录该内容

44 篇文章

订阅专栏

CuPy是一个类似于NumPy的库，但针对GPU进行了优化，最初为Chainer深度学习框架开发，现独立使用。通过将NumPy的'np'替换为CuPy的'cp'，可以在GPU上进行高效的数值计算，但在某些小规模计算中，CPU可能更优。

CuPy 项目地址:https://cupy.chainer.org/

这个项目本来是用来支持Chainer这个深度学习框架的，但是开发者把这个“GPU 计算包”单独分出来了，方便了大家！！！

来看几个例子：

import numpy as np
import cupy as cp
import time

x=np.ones((1024,512,4,4))*1024.
y=np.ones((1024,512,4,1))*512.3254
time1=time.time()
for i in range(20):
    z=x*y
print('average time for 20 times cpu:',(time.time()-time1)/20.)

x=cp.ones((1024,512,4,4))*1024.
y=cp.ones((1024,512,4,1))*512.3254
time1=time.time()
for i in range(20):
    z=x*y
print('average time for 20 times gpu:',(time.time()-time1)/20.)

这里之所以要弄个20次的平均，是因为，最开始的几次计算会比较慢！后面的计算速度才是稳定的，cpu和gpu都有一定这个特性，这个原因cpu和gpu是不同！和“操作系统的本身算法、GPU工作方式”等有关系吧？

接下来，我们把矩阵规模减小

x=np.ones((4,4,4,4))*1024.
y=np.ones((4,4,4,1))*512.3254

x=cp.ones((4,4,4,4))*1024.
y=cp.ones((4,4,4,1))*512.3254

GPU失去了优势，所以也不是所有计算都需要放到gpu上来加速的！有时候cpu算一算也是可以的！

cupy种几乎包含了numpy种通常有的很多function了！所以基本上再用的时候只要把‘np’ 换成‘cp’就好了！很方便