- 博客(5)
- 收藏
- 关注
转载 GPU概念
single instruction, multiple thread (SIMT): a single instruction is executed on several function units in parallelGPU的硬件结构中与CUDA相关的几个概念:thread block grid warp sp smstreaming processor(
2017-04-05 16:55:18
548
转载 GPU 共享内存地址映射方式
当一个warp中的不同线程访问一个bank中的不同的字地址时,就会发生bank冲突。如果没有bank冲突的话,共享内存的访存速度将会非常的快,大约比全局内存的访问延迟低100多倍,但是速度没有寄存器快。然而,如果在使用共享内存时发生了bank冲突的话,性能将会降低很多很多。在最坏的情况下,即一个warp中的所有线程访问了相同bank的32个不同字地址的话,那么这32个访问操作将会全部被序列化,
2017-04-05 16:51:10
1653
转载 GPU共享内存问题
转载某同学的博文其实这两天一直不知道什么叫bank conflict冲突,这两天因为要看那个矩阵转置优化的问题,里面有讲到这些问题,但是没办法,为了要看懂那个bank conflict冲突,我不得不去找资料,说句实话我现在不是完全弄明白,但是应该说有点眉目了,现在我就把网上找的整理一下,放在这边,等哪天完全弄明白了我就在修改里面的错误。 Tesla 的每个 SM 拥有 16K
2017-04-05 16:49:07
6650
转载 静态库和导入库的区别
目前以lib后缀的库有两种,一种为 静态链接库 (Static Library,以下简称“静态库”),另一种为 动态连接库 (DLL,以下简称“动态库”)的导入库(Import Library,以下简称“导入库”)。静态库 是一个或者多个obj文件的打包,所以有人干脆把从obj文件生成lib的过程称为Archive,即合并到一起。比如你链接一个 静态库 ,如果其中有错,它会准确的找
2016-11-22 11:19:42
1348
转载 静态库、动态库及导入库
静态库 1. 静态库扩展名为.lib,静态链接(即代码会直接编译进可执行文件)。静态库是一个或多个obj文件的打包。 2. 在VC中使用静态库的方法: 方法一:在项目属性中添加附加依赖项。 若库目录不在系统和当前目录,选中工程,单击右键,属性-->VC++目录,在库目录中添加库文件所在路径; 选中工程,单击右键,
2016-11-22 11:04:00
550
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人