C++ AMP同CUDA之间的性能比较

本文通过在Core i7-4790k + GTX960及Corei5-2500K + Quadro K600上进行500阶矩阵相乘的测试,对比了CPU、C++ AMP和CUDA的性能。结果显示,CUDA在未优化的情况下仍显著优于C++ AMP和CPU,且开启GPU Boost可能导致计算结果错误。提供了C++、C++ AMP及CUDA的源代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Date:2016-02-03
Author:kagula
Environment:
[1]Win10
[2]VS2013 Update5
[3]Cuda 7.5
从Uvidia官网下载的cuda_7.5.18_windows.exe,cudatoolkit_3.1_win_64.exe

[4]Core i7-4790k + GTX960


测试方式

两个500阶矩阵相乘。


Corei7-4790K+GTX960 测试结果(GPU Boost模式打开情况下)

CPU:          217.866ms
C++ AMP:     35.1236ms
CUDA:              1.969ms

Corei5-2500K+Quadro K600测试结果

CPU:             252.744ms
C++ AMP:     73.1175ms
CUDA:           19.706ms


       CUDA由于对threads做了分块优化,我这里写的cpuamp代码没有优化,所以性能差距很大。


程序提示计算结果有错误,需要关闭boost改进GPU计算的正确性

这里没有进一步测试。


测试用到的代码段

C++源代码


                
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

kagula086

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值