
cuda/GPGPU
shenlan282
这个作者很懒,什么都没留下…
展开
-
OpenGL Interoperability with CUDA
原文地址http://3dgep.com/?p=2082OpenGL Interoperability with CUDAPosted on December 5, 2011Postprocess EffectIn this article I will discuss how you can use OpenGL textures and翻译 2012-03-22 15:07:27 · 2352 阅读 · 0 评论 -
CUDA与C++
1.使用thrust:http://stackoverflow.com/questions/13185221/cuda-host-object-to-devicehttp://blog.youkuaiyun.com/shenlan282/article/details/8237576http://blog.youkuaiyun.com/shenlan282/article/details/8237586原创 2012-11-30 19:07:08 · 2241 阅读 · 0 评论 -
Thrust快速入门教程(一)——简介
http://blog.youkuaiyun.com/dreampursue/article/details/6278726thrust网站 http://thrust.github.com/ Thrust 是一个类似于STL的针对CUDA的C++模板库。Trust提供与CUDA C完全兼容的接口,可以使我们高效地编写高性能并行程序。Thrust提供了丰富的数据并行算法,例如scan、so原创 2012-11-29 10:39:23 · 1682 阅读 · 0 评论 -
Thrust快速入门教程(二)——Vector的使用
http://blog.youkuaiyun.com/dreampursue/article/details/6278737Trust 提供了两个vector容器:host_vector 与 device_vector。按照命名规则,host_vector位于主机端,device_vector位于GPU设备端。Trust的vector容器与STL中的容器类似,是通用的容器,可以存储任何数据类型,可以动原创 2012-11-29 10:40:26 · 4032 阅读 · 1 评论 -
Thrust快速入门教程(三)——迭代器与静态调度
http://blog.youkuaiyun.com/dreampursue/article/details/6278752在这节中我们曾使用了这样的表达式,H.begin() 、H.end()、D.begin() + 7。begin()与end()的返回值在C++中被称为迭代器。vector的迭代器类似于数组的指针,用于指向数组的某个元素。H.begin()是指向H容器中数组第一个元素的迭代器。原创 2012-11-29 10:41:57 · 2124 阅读 · 0 评论 -
cuda的PACK
https://devtalk.nvidia.com/default/topic/387841/structure-pack-issue/When I copy an instance of the following structurefrom Visual Studio C++ code to CUDA code I get erroneous results. struct翻译 2012-11-27 20:16:03 · 825 阅读 · 0 评论 -
关于粗大的纹理
General-purpose programming on GPUFirst steps in CUDAGiuseppe Bilotta, Eugenio Rustico, Alexis HéraultDMI — Università di CataniaSezione di Catania — INGVVector typesCUDA has bui转载 2012-10-09 15:30:40 · 1008 阅读 · 0 评论 -
粗大文件的组织
1 .cu中放kernel2 其他按常规3 kernel的调用要在cu文件中使用extern "C"声明的全局函数调用4 cpp文件中不用包含cu文件5 看 cppIntegration项目原创 2012-10-07 23:15:24 · 656 阅读 · 0 评论 -
【CUDA】初步了解PageLocked host memory的mapped memory功能使用
导言: 大家都知道CUDA 中PageLocked memory 相比portable memory 有着多种优势:在有front-side bus的系统中,pagelocked memory 所提供的host 与device之间的数据传送速度,快得多。测试结果如图Fig.1 Fig.2所示。kernel execution 和 pagelocked memory 与 dev转载 2012-09-28 09:43:29 · 2262 阅读 · 0 评论 -
Use the CUDA Warp Watch
Use the CUDA Warp WatchVS2010的局部变量和全局变量工具窗口只支持在一个thread中查看变量一次,Nsight Debuger使用current focus thread and stack frame来计算这些表达式。Nsight提出cuda Warp Watch的工具窗口,可以展示一个单独的focused Warp中的表达式的值的信息。To翻译 2012-09-27 21:39:03 · 2169 阅读 · 0 评论 -
Nsight
1.点击按钮,找到2.vs2010的菜单中选择:3.vs2010的菜单中选择,选择4.按F11查看内存1.vs2010的菜单中选择,选择,选择2.从窗口点击并拖动一个变量名到窗口,窗口显示该变量的地址值翻译 2012-09-26 21:48:10 · 1048 阅读 · 0 评论 -
[转]如何远程连接运行OpenGL/Cuda 等GPU程序
发现一篇神文,解决了我困扰许久的远程桌面GPU调试问题。。。原地址在这:http://www.tanglei.name/how-to-run-gpu-programs-using-remote-connection/有时候往往需要通过远程桌面连接进行coding工作,像一般的比如web之类的可能不需要GPU等支持的coding工作直接用windows远程桌面连接编码然后debu转载 2014-04-11 12:13:57 · 14074 阅读 · 2 评论