CUDA学习
文章平均质量分 61
evel
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CUDA基础学习笔记
===CUDA介绍===CUDA是一种可扩展的并行编程模型,使得程序不用通过重新编译就可以在任何数量处理器上运行。支持异步系统(如CPU+GPU),CPU和GPU是各自拥有DRAM的独立器件以100多个核心,1000多条并行线程来衡量主要让程序专门用于并行算法,而不是一种并行编程语言的结构===理解CUDA的并行运算===CUDA中的并行抽象的关键:1,同时进行原创 2010-04-26 12:26:00 · 1691 阅读 · 0 评论 -
CUDA在VC2008中的环境搭建与配置要点
<span id="col-z12ncx0wnoqufpcnc23gcreaemakvnwku" class="CSS_UPDATES_UCW_UPDATE_BODY_TEXT CSS_UPDATES_UCW_COLLAPSIBLE_UPDATE"><span class="CSS_UPDATES_UCW_EXPANDED CSS_UPDATES_UCW_HIDDEN CSS_UPDATE原创 2010-04-28 09:53:00 · 2978 阅读 · 0 评论 -
CUDA计算函数集合
unsigned NumberOfBitsNeeded ( unsigned PowerOfTwo ) //===========计算需要运算的点数是 2的几次方,返回指数============={ unsigned i; //左移不关心符号,所以这里定义无符号数 if ( PowerOfTwo < 2 ) //数据必须比2大,否则无意义。 { fprintf原创 2010-05-19 18:24:00 · 1133 阅读 · 0 评论 -
CUDA课程-CS-139G-1:Introduction to Massively Parallel Computing
size_t是为了软件的兼容性和可移植性而产生的,使应用程序不依赖于具体的系统实现size_t是针对系统定制的一种数据类型,一般是整形,因为C/C++标准只定义一最低的位数, 而不是必需的固定位数。而且在内存里,对数的高位对齐存储还是低位对齐存储各系统都不一样。为了提高代码的可移植性,就有必要定议这样的数据类型。一般这种类型都会定义到它具体占几位内存等。当然,有些是编原创 2010-05-20 18:41:00 · 1025 阅读 · 0 评论 -
Fermi核心讲解
引用http://www.mobile01.com/topicdetail.php?f=298&t=1409748&p=6第一張圖片為GF100的完整架構..可以清楚的看到512個CUDA核心(實際上就是流處理器SP),而512個核心分為16組SM(Streaming Muitiprocessor),其中每4組SM加上.一組raster engine.稱為一組GPC陣列(Graphic processing cluster)而GPC陣列算是Fermi的繪圖處理架構..完整的GF100是由4個GPC陣原创 2010-06-04 18:18:00 · 1194 阅读 · 0 评论
分享