Date:2016-02-03
Author:kagula
Environment:
[1]Win10
[2]VS2013 Update5
[3]Cuda 7.5
从Uvidia官网下载的cuda_7.5.18_windows.exe,cudatoolkit_3.1_win_64.exe
Author:kagula
Environment:
[1]Win10
[2]VS2013 Update5
[3]Cuda 7.5
从Uvidia官网下载的cuda_7.5.18_windows.exe,cudatoolkit_3.1_win_64.exe
[4]Core i7-4790k + GTX960
测试方式
两个500阶矩阵相乘。
Corei7-4790K+GTX960 测试结果(GPU Boost模式打开情况下)
CPU: 217.866ms
C++ AMP: 35.1236ms
CUDA: 1.969ms
Corei5-2500K+Quadro K600测试结果
CPU: 252.744ms
C++ AMP: 73.1175ms
CUDA: 19.706ms
CUDA由于对threads做了分块优化,我这里写的cpu和amp代码没有优化,所以性能差距很大。
程序提示计算结果有错误,需要关闭boost改进GPU计算的正确性。
这里没有进一步测试。
测试用到的代码段
C++源代码