CUDA SDK2.3 示例程序说明

本文精选了一系列CUDA应用案例,包括性能优化、金融分析、图像处理等多个领域。从数据类型对齐到异步API使用,再到各类算法实现如排序、卷积、特征值分解等,为读者提供了丰富的实践参考。
部署运行你感兴趣的模型镜像

alignedTypes 演示了数据类型对齐对性能的影响

asyncAPI 演示了如何使用异步API

bandwidthTest 测试主存与显存之间,以及显存内部进行数据传输时的带宽,通过命令行可以进行更加全面的测试。
bicubicTexture 通过texture实现双立方插值
binomialOptions binomialOption金融分析例子程序
bitonic Bitonic排序
BlackScholes BlackScholes金融分析例子程序
boxFilter 盒型滤波器,图像处理可以参考
clock 测时函数的使用方法
convolutionFFT2D 使用二维FFT实现卷积
convolutionSeparable 二维卷积的一种实现
convolutionTexture 使用纹理实现的二维卷积
cppIntegration 如何封装CUDA函数,并在C++程序中调用
cudaOpenMP CUDA与openMP同时使用的例子
dct8x8 离散余弦变换,图像、编解码、压缩等可参考
deviceQuery 查询设备参数,运行时eAPI版本
deviceQueryDrv DeviceQueryDrv,驱动API版本
dwtHaar1D 一维哈尔变换
dxtc DirectX纹理压缩
eigenvalues 特征值分解
fastWalshTransform. 快速瓦尔希变换
fluidsD3D9 流体计算示例,D3D9实现
fluidsGL 流体计算示例,openGL实现
histogram64 直方图,64个结果
histogram256 直方图,256个结果
imageDenoising 图像降噪
lineOfSight 视线计算
Mandelbrot 分形数学计算
marchingCubes 使用marchingCubes算法细分表面
matrixMul 稠密矩阵乘法,运行时API版本
matrixMulDrv 稠密矩阵乘法,驱动API版本
MersenneTwister MersenneTwister随机数发生器
MonteCarlo 蒙特卡罗模拟
MonteCarloMultiGPU 蒙特卡罗模拟,多GPU并行版本
nbody N-body模拟星系间作用力
oceanFFT 使用FFT算法模拟海面
particles 粒子系统计算
postProcessGL OpenGL渲染后计算(模糊)
quasirandomGenerator Quasi随机数发生器
recursiveGaussian 使用递归算法实现高斯模糊
reduction 常用的并行缩减例子,演示了如何对并行缩减进行优化
scalarProd 向量缩放
scan Scan算法
scanLargeArray 对大型数组的scan
simpleAtomicIntrinsics 原子加示例
simpleCUBLAS CUBLAS使用方法
simpleCUFFT CUFFT使用方法
simpleD3D9 与D3D9互操作
simpleD3D9Texture 与D3D9纹理互操作
simpleD3D10 与D3D10互操作
simpleD3D10Texture 与D3D10纹理互操作
simpleGL 与openGL互操作
simpleMultiGPU 多GPU并行计算
simpleStreams Stream演示
simpleTemplates 模版使用演示
simpleTexture 纹理使用演示,运行时API版本
simpleTexture3D 三维纹理演示
simpleTextureDrv 纹理使用演示,驱动API版本
simpleVoteIntrinsics Vote功能演示
simpleZeroCopy ZeroCopy/Mapped Memory演示
smokeParticles 烟雾粒子系统
SobelFilter Sobel边缘检测
SobolQRNG Sobel-Quasi随机数发生器
template 用于建立新程序的模版
threadFenceReduction Fence使用演示
threadMigration 通过驱动API改变当前上下文,实现线程迁移
transpose 转置
transposeNew 改进版转置,避免了分区冲突
volumeRender 体渲染例子

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值