自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(88)
  • 收藏
  • 关注

原创 word代码粘贴

方法一:(本人尝试过,可行)1:安装NotePad++2:粘贴代码到NotePad++中3:在菜单中的“语言”将代码设置为对应的编程语言4:菜单操作:插件>NppExport>Copy HTML to clickbord5:直接在word中选择粘贴即可完成方法二:(Office 2007下失败了)1:选择任意编辑器,粘贴代码到编辑器中2:在word菜单操作:

2013-04-03 16:25:56 1449

转载 vim入门(三)

转自:http://blog.youkuaiyun.com/zg_hover/article/details/1232018本章提供足够的信息使你用够使用 Vim 来做基本的编辑。这里提供的方法不一定是高效 快捷的。但起码是有效的。花些时间去练习这些命令,这是后面的知识的基础。 |02.1|  第一次运行 Vim |02.2|  插入文本 |02.3|  移动光标 |02.4|

2013-02-26 15:30:53 473

转载 The Shift & Tab Won't Work in Word 2007

From:http://www.ehow.com/how_7226500_shift-won_t-work-word-2007.htmlInstructions1Launch Microsoft Word 2007.2Click the "Office" button in the top left corne

2013-02-26 09:39:18 495

原创 Windows Java 安装过程及基本概念简介

鉴于让自己可以更好地理解安装过程究竟安装了什么,为什么要安装这些东西,先查了一下各种基本概念的含义:J2EE:Java 2 Enterprise Edition,企业版本,一般个人开发不用使用这个J2SE:Java 2 Standard Edition,标准应用开发版本,一般选择这个做个人开发J2ME:Java 2 Micro Edition,微型版,针对手机或者PDA等嵌入式开发

2013-01-21 13:08:39 719

原创 基于CUDA的GPU优化建议

l GPU硬件特性n 存储层次u Global memory:l 大小一般为几GBl chip-off的DRAM介质存储器l 访问速度慢(是shared memory的上百倍)l 对于是否对齐和连续访问敏感(由DRAM的性质决定)l 可以被所有的线程访问u Shared memory:l 每个SM中一般几十KBl ch

2012-12-06 15:01:38 1666 6

原创 论文阅读笔记4

l 论文四摘要n 题目:Fast Implementation of DGEMM on Fermi GPUn 摘要:u 使用了分块算法(在shared memory和register上)实现了双精度的稠密矩阵乘法(Fermi架构)u 优化内容:软件流水线,向量存储操作,指令调度u 性能:在最新的CUBLAST基础上,提升了20%,达到362Gflop/sn 内容

2012-12-06 15:01:35 487

原创 论文阅读笔记3

l 论文三摘要n 题目:An Analytical Model for a GPU Architecture with Memory-level and Thread-level Parallelism Awarenessn 摘要:u 提出一个衡量程序运行时间的模型:主要从运行时线程数量(#running threads)和存储带宽(memory bandwidth)两个方面来考

2012-12-06 15:01:33 563

原创 论文阅读笔记2

l 论文二摘要n 题目:An Accurate GPU Performance Model for Effective Control Flow Divergence Optimizationn 摘要:u 指出GPU的执行特点:大批量线程,SIMD执行模式,divergence的不良影响u 论文工作内容:提出一个简单而准确的衡量标准,用于估算以计算为主的GPU kernel

2012-12-06 15:01:31 575

原创 论文阅读笔记1

l 论文一摘要n 题目:a quantitative performance analysis model for GPU architectures(GPU架构上的一个定量的性能分析模型)n 摘要:u 提出了一个吞吐量模型(5-15%错误率),用于衡量三个主要组成部分:指令流水线,共享内存访问,全局内存访问u 测试的实验例子:稠密矩阵乘法,三对角线性方程组求解(优化60%

2012-12-06 15:01:29 494

原创 大规模并行处理器编程实战笔记5

浮点运算1:浮点格式浮点数的表示:S(符号位),E(阶码),M(尾数)S:0/1M:1E:使用余码表示,方便直接按照无符号数的方式进行比较大小n位余码的计算方式:对n位原码求补码,再加上(2^(n-1) - 1)构成,等价于对某个十进制数取余例子:按照二进制补码的顺序排序的余3码二进制补码    十进制值   余码表示000          0        

2012-12-06 15:01:27 673

原创 大规模并行处理器编程实战笔记4

1:更多关于线程执行的问题warp的一些限制:对于那些大小不是32的整数倍的块,最后一个warp会用别的块中的线程来填充,直到满足32个线程为止warp divergence的问题:如果if-then-else结构中同一个warp中的线程不满足同一个条件,那么,一个warp中的线程有一部分通过then路径,一部分通过else路径,warp按照顺序来通过这些路径,导致执行时间的增加。

2012-12-06 15:01:24 507

原创 转载:成为GPU架构师

以下文章出自:http://blog.renren.com/share/313938359/4576928475#nogo 说来我也不是正经做GPU架构的,不过耳濡目染了很久写一写自己的心得。GPU架构设计其实算是一个多学科交叉的领域,尤其是今天这种GPGPU改朝换代的年代,更需要多多吸收相关领域的知识。这包含了计算机体系结构,图形算法,编译技术,集成电路,以及各种流计算应用等五部分~~

2012-12-06 15:01:22 878

原创 计算机网络中各层的一些协议

计算机网络协议应用层  ·DHCP(动态主机分配协议)  ·DNS (域名解析)  ·FTP(File Transfer Protocol)文件传输协议  ·Gopher (英文原义:The Internet Gopher Protocol 中文释义:(RFC-1436)网际Gopher协议)  ·HTTP (Hypertext Transfer Protocol

2012-12-06 15:01:20 687

原创 DOS下面的一些命令

以下内容转自:http://hi.baidu.com/krkjjpwzdolnryr/item/b1ddd4cedcc19a66f7c95d2aPS:官方的网址也可以参考http://www.computerhope.com/msdos.htm#02DOS常用命令 要想操作使用DOS,知道一些常用命令是非常重要的。以下是一些命令的用法。 文件名是由文件路径和文件名

2012-12-06 15:01:18 309

原创 TCP/IP 协议基本知识笔记

1:TCP/IP 分层   1.1 链路层:设备驱动程序,接口卡   1.2网络层:IP,ICMP,IGMP   1.3 运输层:TCP,UDP   1.4应用层:Telnet,FTP,e-mail等2:TCP/IP 封装   2.1 TCP报文(TCPsegment):TCP传给IP的数据单元   2.2 IP数据报(IPdatagram):IP传给网络接口层的数据单元

2012-12-06 15:01:16 319

原创 排序算法:实现,平均复杂度,最好…

1:冒泡算法    1.1 实现void bubbleSort(int *a, int n){       int i;       int j;       int flag;       for(i = 0; i        {              flag = 0;              for(j = 0; j <n - i - 1;

2012-12-06 15:01:14 723

原创 一些智力题和他们的答案

转自:http://bbs.yingjiesheng.com/thread-18573-1-1.htmlA.逻辑推理      1、你让工人为你工作7天,给工人的回报是一根金条。金条平分成相连的7段 ,你必须在每天结束时给他们一段金条,如果只许你两次把金条弄断,你如何给你 的工人付费?   2、请把一盒蛋糕切成8份,分给8个人,但蛋糕盒里还必须留有一份。  3、小明一家过一座桥,

2012-12-06 15:01:11 519

原创 关于进程的虚拟地址空间

下面的内容总结自:《深入理解计算机系统》进程的虚拟地址空间:两种一样的方式自上而下地址递减:内核虚拟存储器(用户代码不可见)(向低地址扩展)共享库的存储器映射区域(例如标准函数:printf())运行时堆(malloc创建) ->(向高地址扩展)读写数据只读的代码和数据未用自左而右地址递增:未用 | 只读的代码和数据 | 读写数据 | 运行时堆(malloc创建) -

2012-12-06 15:01:09 429

原创 位运算实现加法的一个简单例子

一个笔试题目,测试了一下,没有错,不过性能不用测试就知道差非常远了~最朴素的想法,用异或操作实现不进位相加,用并操作实现进位标志检测,若有,则左移(进位),继续该过程直到没有进位出现,则异或的结果为最终结果#include#includeint bitAdd(int a, int b){int and;int xor1, xor2;and = a & b;xor1 = a

2012-12-06 15:01:07 408

原创 操作系统读书笔记之二

l 进程      n 一个具有一定独立功能的程序在一个数据集合上的一次动态执行过程n 引入进程有利于描述程序并发执行时对系统资源的共享n 引入进程提高了对硬件资源的利用,也带来额外的开销,增加OS的复杂性l 进程的特征n 动态性:创建(产生),调度(执行),无资源(阻塞),撤销(死亡)n 并发性:多个进程实体同时存在与内存中,在一段时间内同时运行n 独

2012-12-06 15:01:05 296

原创 操作系统读书笔记之一

l 通道n 专门控制I/O设备与内存间的数据传输,实现独立于CPU的I/O操作n 具有专用的I/O处理器,与CPU并行工作n 实现I/O联机处理l 中断n CPU收到外部中断信号后,停止原有工作,先处理该中断事件,而后又转回继续执行原来工作n 中断请求-》中断响应-》终端点-》中断处理例程-》中断返回n 通道和中断的结合可以使得I/O设备与主机联机并行操

2012-12-06 15:01:02 309

原创 VIM入门(二)

转载地址:http://linux.chinaunix.net/techdoc/desktop/2009/07/06/1122020.shtml读本文之前请注意:1.本文的目标是提供一些vim的使用技巧,利用这些技巧可以提高vim的操作效率。部分技巧在vi上也可以使用,但是现在基本上都是用vim了。2.本文是整理和总结使用技巧,而非讲解vim入门,因此不会涉及最基本的使用

2012-12-06 15:01:00 199

原创 Linux添加PATH环境

几种方法:1:每次都使用的命令export PATH=MY_FILE_PATH:$PATH上面的 MY_FILE_PATH换成应用程序的二进制文件所在目录即可,一般在bin里面(下同)查看是否成功:echo$PATHPS:这种方法每次关闭终端就会失效,仅一次行使用2:修改home目录下的.bash_profile文件(因为有时候/etc/profile普通用户是没有修改权限的

2012-12-06 15:00:58 300

原创 windows下面使用gcc和vim编程

1:使用Dev-Cpp来支持gcc1.1:下载Dev-Cpp1.2:安装好Dev-Cpp1.3:找到gcc执行程序所在的文件夹(一般为bin)1.4:将gcc.exe属性中的绝对路径复制出来1.5:到电脑->高级->环境变量->用户环境变量中添加路径1.6:变量名:PATH,变量值:粘贴1.4复制出来的路径(如果有其他路径,分号隔开)1.7:重新启动命令行:Win+R,cmd回车,

2012-12-06 15:00:56 428

原创 x86指令集的一点总结介绍(未完待…

l x86通用(或常用)指令:n 数据传送:u mov:复制数据u movsx:符号填充,用源的符号位填充高位u movzx:零填充,用0填充高位u xchg:交换两个操作数的值,操作数类型需要相同u lea(load efficient address):取有效地址,把一个内存变量的有效地址送给指定的寄存器u push:操作数进栈u pusha:

2012-12-06 15:00:53 1410 1

原创 GCC内联汇编实现向量规约的例子

有了前面一个基础,这个就比较容易折腾出来了,只是换了个表达方式,所以也很快就出炉,负责计算的函数的性能仍然跟GCC(3.4.5)优化后的时间一致,但是因为不知道怎么进一步该这个程序,所以就只能到这个地步了,以后有改进的会继续发布。#include#include#define N1024*1024*1024#define M10intvector_reduction(int *

2012-12-06 15:00:51 420

原创 GCC内联汇编实现向量加法的例子

花了一天多看别人的代码,查看命令和AT&T的指令格式,总算自己搞出一个还算能够运行的汇编函数,不过,话也说回来,这个函数真正计算的时间只有12s,但是同样的环境下,使用了GCC(3.4.5版本)的优化过的程序来跑,却也需要16s,看来还真是高效率,因为本人还不懂的如何对汇编程序优化...#include#include#define N1024*1024*1024#define

2012-12-06 15:00:49 941

原创 GCC内联汇编中使用的AT&amp;T指令格式…

转自:http://www.cnblogs.com/lxgeek/archive/2011/01/01/1923738.htmlGAS中每个操作都是有一个字符的后缀,表明操作数的大小。C声明GAS后缀大小(字节)charb1shortw2(unsigned) int / long / char*

2012-12-06 15:00:46 881

原创 C内嵌汇编简介

l 简要介绍n 关键字u __asm__:必须的;__volatile__:非必须的n 格式u __asm__ __volatile__ (“instruction list” : output:input : clobber/modify);u 上述除了四个部分都可以缺省,当后面三个部分没有的时候退化成基本内联汇编,否则为GCC内联汇编n 各个操作数含义

2012-12-06 15:00:44 584

原创 C内嵌汇编简单示例

一:创建example.c#include int add(int , int);int main(){       int a;       int b;       a = 1;       b = 2;       a = add(a,b);       printf("a = %d, b = %d\n", a, b);       return 0;

2012-12-06 15:00:42 576

原创 vim的高亮配置问题

vim编辑器的高亮配置需要一个配置文件(vimrc),置于主文件目录下(即直接cd所在的目录),再启用vim就可以有各种语言的高亮显示了

2012-12-06 15:00:39 210

原创 x86架构处理器一览

YearIntel CoreCPUFeaturePFM_cmp19714004MicroProcessor400445Is,108KHz,4-bit119728008MicroProcessor8008200KHz219748080MicroProcessor80802MHz1019788086-8088MicroProces

2012-12-06 15:00:37 1679

原创 chrome快捷键收集

以下文章转自:http://www.douban.com/group/topic/13802153/chrome窗口和标签页快捷键: Ctrl+N 打开新窗口 Ctrl+T 打开新标签页 Ctrl+Shift+N 在隐身模式下打开新窗口 Ctrl+O,然后选择文件 在谷歌浏览器中打开计算机上的文件 按住 Ctrl 键,然后点击链接从后台在

2012-12-06 15:00:35 203

原创 Thinking&nbsp;in&nbsp;Java&nbsp;读书笔记之一

第一章的内容smalltalk的特征:所有东西都是对象程序是一大堆对象的组合每个对象都有自己的存储空间每个对象都有一种类型(能将什么消息发给它?)同一类所有对象都能接收相同的消息(类似多态)单根结构:简化参数传递垃圾收集器可以讲适当的消息发给系统内的任何对象永远不会遇到判断不出一个对象的类型的情况清除对象:垃圾收集器自动释放不再使用的对象垃圾收集器的启动和运行时间都未知

2012-12-06 15:00:33 256

原创 转载:CAS——归档应用的最佳选择&nbsp;&nbsp;—…

存储百家谈内容寻址存储(CAS)技术的魅力就在于,以用户保存的每一份数据“内容”为依据,生成唯一一个内容地址,并在此基础之上可为数据增添其他属性,实现对数据的保护、检索、查重等各种操作。与传统的位置寻址存储技术相比,它更能满足固定内容的主动归档与长期保存的需求。 鈥斺敼仁萍脊綜EO周涛谈内容寻址存储技术" TITLE="转载:CAS鈥斺敼榈涤τ玫淖罴蜒≡  鈥斺敼仁萍脊綜EO周涛谈内容寻址存

2012-12-06 15:00:31 823

原创 转载:选择CAS的六个理由

传统上,保存归档数据的存储架构为SAN、NAS、磁带库(或光盘库)模式,而这类存储管理模式产生于在线存储磁盘阵列成本较高的年代,单纯采用磁盘阵列作为主要存储设备。    随着用户需要永久保存的信息越来越多,传统方式一方面成本非常高,容量固定且有限,另一方面又易受病毒攻击,不利于数据保存。传统模式的弊端传统模式的成本过高。由于用户的存储数据呈现持续线性增长,而

2012-12-06 15:00:28 702

原创 转载:剖析:文件虚拟化以及四种SA…

四种SAN虚拟架构  存储虚拟化在主机和物理存储之间创造一个抽象层,当SAN实施时,它为所有的块级存储提供一个单点管理。简单来说,多个异构网络存储设备构成一个虚拟存储池,在主机上表现为使用一套虚拟存储卷。  在短短的几年内,存储虚拟化,也称作虚拟块,已经在大企业中证明了它的价值,从昂贵的解决方案转化成可以负担得起的商品,相关文章见《利用对称式虚拟存储提高存储效率》。作为一种标准特征,

2012-12-06 15:00:26 510

原创 Ubuntu下KDE安装过程

一句命令搞定,需要下载1v30M,安装后需要占用空间550Msudo apt-get install kubuntu-desktop下载完成后,终端自动进行配置,之后变成一个蓝屏的文字窗口,询问要选择Kdm 还是gdm,这里只是开机登陆窗是UbuntuKDE安装的还是GNOME的差别而已。这样安装后的Ubuntu KDE安装界面是英文的,所以再安装中文语言。 sudo apt-geti

2012-12-06 15:00:24 494

原创 Ubuntu下的CUDA编程(六)——原子操…

test03.cu文件中的代码:1 #include  2 //#include  3 #include"cutil.h"  4 //#include"device_functions.h"  5 #include"sm_12_atomic_functions.h"  6 #define SIZE 100 *1024 * 1024 7   8 voidgenera

2012-12-06 15:00:22 715

原创 多核集群上行的混合模型笔记01

集群系统:利用网络将计算机按照某种结构连接起来,在并行计算环境下支持统一调度的并行系统。多核技术:一个处理器中集成两个或更多完整的计算引擎(核),使用多线程充分执行多个执行内核。并行编程模型(针对SMP?):数据并行,消息传递,共享存储三种。消息传递模型:底层为一组处理器,每个处理器有自己的内存且只能访问本地的指令和数据(MPI为标准例子)。MPI的优缺点:MPI可移植

2012-12-06 15:00:19 501

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除