对深度学习程序进行性能优化之前该理解的几个知识点(一)

:数据存储在硬盘的时候都是以簇为单位的,即数据存储的单位。无论文件的大小如何,除非正好是簇的整数倍,否则文件所占用的最后一个簇都会产生一些剩余空间。并且这些剩余空间不能为其他文件所用,即使是这个文件只有0字节,也不能允许两个文件及以上共用一个簇,否则会造成数据的混乱。

CPI含义为每指令周期数,IPC即每周期指令数,CPI=1/IPC。

PMU(Performance Monitoring Unit):性能监控单元。

PI/Cycle事件计数指标,其中PI可以是任何一个PMU事件记数,cycle为处理器周期。

icache用来缓存指令,dcache =用来缓存数据。cup与主存之间存在多级高速缓存,一般分为三级,分别为L1,L2,L3,代码由指令和数据组成。L1Cache比较特殊,每个CPU会有两个L1Cache,分别为指令高速缓存(Instruction Cache 简称ICache)和数据高速缓存(DataCache,简称dCache)。L2,L3一般不区分指令和数据,可以同时缓存指令和数据。

为什么区分指令和数据?

性能考量:CPU在执行程序时,可以同时获得指令和数据,做到硬件上的并行,另外指令和数据有很大的不同。如指令不会被修改,所以iCache在硬件设计上是可以只读的,这在一定程度上降低硬件设计的成本。

DTB(Data Transfer Bus)数据传输总线

DMA(Direct Memory Access,直接存储器访问)它允许不同速度的硬件装置来沟通,而不需要依赖于CPU的大量中断负载。DMA传输将数据从一个地址空间复制到另一个地址空间。当CPU初始化这个传输动作,传输动作本身是由DMA控制器来实行和完成。典型例子就是移动一个外部内存的区块到芯片内部更快的内存区。

Mem(内存),MEM_ACCESS指应用程序的可用内存。

API(Application Programming Interface,应用程序接口),是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。

proc是一种虚拟文件系统,也叫进程数据文件系统,其信息不是存储在块设备中,在读取、proc目录下的文件的时候才会去动态生成。/proc文件系统可以获得很多进程信息。

/proc文件系统的容量依系统而不同(如硬件配置、体系结构)。主要包括以下:

        系统进程的特征数据

         内存管理

         文件系统

         设备驱动程序

         系统总线

         电源管理

         终端

         系统控制参数

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值