
GPGPU-Sim
大光叔叔
这个作者很懒,什么都没留下…
展开
-
GPGPU-Sim学习(零)-写在前面
博客再一次搬家(好吧,其实是自己始终没坚持下去)。迁到优快云上的原因一是这里有关于CUDA的东西(以前在科学网和博客园上都木有),还有一个就是可以用Markdown。加上新学期,又有三分热血写博客了。在做GPGPU-Sim的这段时间内,经历了很多坎坷,自己也慢慢脱离了菜鸟阶段。也意识到以前想写《 GPGPU-Sim研究 》系列是多么的无知,所以改为《 GPGPU-Sim学习 》。这段时间内也碰见了原创 2015-03-17 20:26:14 · 1815 阅读 · 1 评论 -
GPGPU-Sim学习(二)搭建GPGPU-Sim环境(ubuntuServer 10.04 安装GPGPU-Sim)
最近发现在sim的官网那个已经给出了安装好gpgpu-sim的虚拟机,也是大家的福音。请戳官网链接http://gpgpu-sim.org/,我的写一篇《GPGPU-Sim学习(二)(补充)gpgpu-sim官网所给虚拟机与自己所搭建虚拟机的使用感受》 本阶段的主要任务就是安装GPGPU-Sim,安装步骤是从带我那个学长写的一篇日志里,加上我自己的安装过程中的一些体会。学长日志链接:http:/原创 2015-03-18 21:47:45 · 4765 阅读 · 0 评论 -
GPGPU-Sim学习(二)(补充)gpgpu-sim官网所给虚拟机与自己所搭建虚拟机的使用感受
最近GPGPU-Sim的官网竟然给出了自己的虚拟机,这绝对是GPGPU-Sim学习者的最大福利了。因为安装sim的周期一般需要一个周,需要反复尝试很多次(20+),而且就目前我所遇见的simer,花这么多时间,50%安装失败了。好吧,一共只有六个人而已,可见这个仿真器在国内是多么的小众。偶然发现官网上的虚拟机,就赶紧下下来用了一下~下面是一些自己的使用感受 类别 官方所给虚拟机 自己配原创 2015-03-24 21:35:11 · 4460 阅读 · 8 评论 -
GPGPU-Sim学习-如何禁用GPGPU-Sim内的L1 cache
最近在做一个观察实验,把L1 cache禁用以后,看看benchmark的IPC。在Sim 文档中并没有禁用L1 cache的描述,但是Sim的代码中却考虑到了这一因素,所以我们可以直接修改几行代码达到禁用L1 cache的效果。修改代码如下即可: gpu-cache.h class cache_config 将 bool m_disabled; 属性修改为 public。 shad原创 2015-03-29 10:33:00 · 1639 阅读 · 1 评论 -
GPGPU-Sim学习(一)-GPGPU-Sim介绍
本部分内容分为以下几个部分:概括性地介绍GPGPU-Sim、学习GPGPU-Sim的建议步骤、部分资料概括性地介绍GPGPU-SimGPGPU-Sim,通过单线程方式模拟出GPU多线程运行效果,并输出统计数据,是当前比较流行的GPGPU模拟器。目前国内外相当一部分关于GPGPU的研究都是使用的GPGPU-Sim。GPGPU-Sim是用C语言实现的,使用者可以通过合理修改GPGPU-S原创 2015-03-18 11:53:50 · 6101 阅读 · 0 评论 -
拷贝global memory,cudaMemcpyToSymbol 和cudaMemcpy函数是否有区别
这是今天在群里有人问了这么一个问题 cudaMemcpyToSymbol可以将数据从host拷贝到global,cudaMemcpy也是从host到>global,这种情况下二个函数有什么区别吗?和各位大佬讨论一下后,和大家分享一下~首先,学到了cudaMemcpyToSymbol竟然还有将数据从host拷贝到global的功能,以前只用过这个函数拷贝constant memory。拷贝方式原创 2015-04-14 19:56:20 · 7901 阅读 · 1 评论 -
GPGPU-Sim(番外)-如何加快GPGPU-Sim的运行速度
序言GPGPU-Simer都应该体验过Sim在虚拟机中奇慢无比的速度,一个在真实环境下几ms就跑完的benchmark,在Sim下通常需要几十分钟到几小时。跑一次实验benchmark多了基本就得一天,比较浪费时间。 等待总是无聊的,本篇博客将给出我自己总结的几种加快Sim运行速度的解决方案。方案一:堆硬件ssd,加内存,上好CPU,使劲堆,有钱任性方案二:减少Sim输出输出信息打印出来是很耗时间原创 2015-11-24 15:20:24 · 2842 阅读 · 0 评论 -
GPGPU-Sim(番外)-GPGPU-Sim的模拟机制
这是我本科毕设内容的一部分,内容是一篇论文中的一部分,仅供学习,欢迎拍砖如图,我们展示了CUDA应用程序在GPU和GPGPU-Sim下的编译运行过程。 CUDA应用程序分为device代码和host代码。当在GPU上编译CUDA应用程序时,nvcc编译器会将device代码和host代码区分开。device代码会被编译成ptx,再由ptxas编译成cubin.bin文件,最后再和host代码、l原创 2015-11-24 14:59:09 · 2379 阅读 · 0 评论 -
GPGPU-Sim学习(代码解读)-如何实现Bypass L1D cache
GPGPU-Sim bypass原创 2015-12-05 11:28:24 · 3731 阅读 · 6 评论