
software performance engineeri
whenloce
这个作者很懒,什么都没留下…
展开
-
Performance Engineering of Software Systems (一)——准备工作
目录一、概述二、vtune2.1 安装2.2 使用三、总结 一、概述一直都想系统的学习一下代码优化,这几天无意从豆瓣上发现有一门叫做Performance Engineering of Software Systems的MIT公开课,简单看了下简介感觉无比汗颜——居然是本科生的课程。感慨有个好的引导真是重要。静下心来,觉得还是少发牢骚,研究一下一直感兴趣的东西吧。...原创 2019-02-13 17:09:58 · 1274 阅读 · 0 评论 -
编程基础(四)——cache之一
目录一、概述二、原理2.1 局部性原理(principle of locality)2.2 Memory Hierarchy2.3 性能评估三、cache的基本要素3.1 cache的组成3.1.1利用hash表理解cache参数和行为3.2 cache的分类3.3cacheline size3.4cache hit & cache mis...原创 2019-05-04 22:29:59 · 2340 阅读 · 0 评论 -
编程基础(三)——体系结构
目录一、概述二、流水线2.1 基础知识2.2 顺序实现2.3 经典的五级流水线2.4 流水线冒险2.4.1 结构冒险2.4.2 数据冒险2.4.3 控制冒险2.5 动态调度2.6 超标量 & 超线程三、参考一、概述主要是按照自己的思路对体系结构书籍和文章的一些罗列和总结,主要是作为性能优化的一个基础,梳理自身的知识,备忘,可能其中有理...原创 2019-02-13 17:06:49 · 882 阅读 · 0 评论 -
编程基础(二)——汇编
目录 一、概述二、x86_64 (AT&T)2.1 数据格式2.2 寄存器2.2.1格式2.2.2 调用规范2.3 寻址2.4 指令2.4.1 数据传送指令2.4.2 栈操作2.4.3 算术&逻辑操作2.4.4 乘法&除法2.4.5 控制——比较指令2.4.6 控制——跳转2.4.7 控制——循环2.4....原创 2019-02-13 17:06:03 · 830 阅读 · 0 评论 -
编程基础(一)——计算机中的数
目录一、综述二、整数2.1 整数的表示2.1.1 ones' complement & two's complement2.1.2 有符号数和无符号数的转化关系2.1.3 数的扩展2.2 整数的运算2.2.1 无符号加法2.2.1 补码加法三、数的特性对C编程的影响3.1 无符号数和有符号数3.1.1 数3.1.1 cast3.1....原创 2019-02-13 17:04:31 · 736 阅读 · 0 评论 -
Performance Engineering of Software Systems (四) ——工具使用
目录一、概述二、perf2.2 perf stat2.3 perf top2.4 perf annotate2.5 perf record2.6 perf report三、intel vtune四、case study——矩阵乘法五、参考一、概述对应于lecture-1-matrix-multiply-a-case-studylecture-...原创 2019-02-17 14:23:55 · 932 阅读 · 0 评论 -
编程基础(三)——体系结构之三
目录一、概述二、ROB2.1 ROB结构2.2 Tomasulo with ROB2.2.1 issue2.2.2 dispatch2.2.3 broadcast2.2.4 commit2.2.5 引入rob后对比三、其他3.1 Unified Reservation Station3.2 Terminology Confusion四、load ...原创 2019-02-15 17:23:19 · 1732 阅读 · 0 评论 -
编程基础(三)——体系结构之二
目录一、概述二、性能指标和评估三、pipeline3.1 一个典型的五级流水线3.2 pipeline stall3.3 pipeline flush3.4 forward3.5 Dependencies3.5.1 Control dependencies3.5.2 Data dependencies3.6 冒险四、branch prediction...原创 2019-02-15 13:27:07 · 2927 阅读 · 1 评论 -
编程基础(五)—— 虚拟内存
目录一、概述二、虚拟内存的出现三、虚拟内存发展和演进3.1 DynamicRelocation (base and bounds)3.2 segmentation3.3 paging3.3.1 第一种优化——TLB3.3.2 第二种优化——多级页表四、参考一、概述OSTEP memory virtualization相关章节笔记,主要为了理清虚拟内存...原创 2019-06-26 19:03:39 · 1112 阅读 · 0 评论